Spaces:

MilesCranmer
/

PySR

Sleeping

App Files Files Community

MilesCranmer commited on Aug 10, 2022

Commit

c41cf33

unverified ·

2 Parent(s): 8775039 593c674

Merge pull request #176 from MilesCranmer/normal-csv-format

Browse files

Files changed (5) hide show

pysr/sr.py +5 -5
pysr/version.py +2 -2
test/test.py +5 -5
test/test_jax.py +6 -6
test/test_torch.py +9 -9

pysr/sr.py CHANGED Viewed

@@ -469,7 +469,7 @@ class PySRRegressor(MultiOutputMixin, RegressorMixin, BaseEstimator):
         Whether to use a progress bar instead of printing to stdout.
     equation_file : str, default=None
-        Where to save the files (.csv separated by |).
     temp_equation_file : bool, default=False
         Whether to put the hall of fame file in the temp directory.
@@ -1969,12 +1969,12 @@ class PySRRegressor(MultiOutputMixin, RegressorMixin, BaseEstimator):
                     cur_filename = str(self.equation_file_) + f".out{i}" + ".bkup"
                     if not os.path.exists(cur_filename):
                         cur_filename = str(self.equation_file_) + f".out{i}"
-                    df = pd.read_csv(cur_filename, sep="|")
                     # Rename Complexity column to complexity:
                     df.rename(
                         columns={
                             "Complexity": "complexity",
-                            "MSE": "loss",
                             "Equation": "equation",
                         },
                         inplace=True,
@@ -1985,11 +1985,11 @@ class PySRRegressor(MultiOutputMixin, RegressorMixin, BaseEstimator):
                 filename = str(self.equation_file_) + ".bkup"
                 if not os.path.exists(filename):
                     filename = str(self.equation_file_)
-                all_outputs = [pd.read_csv(filename, sep="|")]
                 all_outputs[-1].rename(
                     columns={
                         "Complexity": "complexity",
-                        "MSE": "loss",
                         "Equation": "equation",
                     },
                     inplace=True,

         Whether to use a progress bar instead of printing to stdout.
     equation_file : str, default=None
+        Where to save the files (with `.csv` extension).
     temp_equation_file : bool, default=False
         Whether to put the hall of fame file in the temp directory.
                     cur_filename = str(self.equation_file_) + f".out{i}" + ".bkup"
                     if not os.path.exists(cur_filename):
                         cur_filename = str(self.equation_file_) + f".out{i}"
+                    df = pd.read_csv(cur_filename)
                     # Rename Complexity column to complexity:
                     df.rename(
                         columns={
                             "Complexity": "complexity",
+                            "Loss": "loss",
                             "Equation": "equation",
                         },
                         inplace=True,
                 filename = str(self.equation_file_) + ".bkup"
                 if not os.path.exists(filename):
                     filename = str(self.equation_file_)
+                all_outputs = [pd.read_csv(filename)]
                 all_outputs[-1].rename(
                     columns={
                         "Complexity": "complexity",
+                        "Loss": "loss",
                         "Equation": "equation",
                     },
                     inplace=True,

pysr/version.py CHANGED Viewed

	@@ -1,2 +1,2 @@
1	- __version__ = "0.9.5"
2	- __symbolic_regression_jl_version__ = "0.9.7"


1	+ __version__ = "0.10.0"
2	+ __symbolic_regression_jl_version__ = "0.10.0"

test/test.py CHANGED Viewed

@@ -288,10 +288,10 @@ class TestPipeline(unittest.TestCase):
     def test_load_model(self):
         """See if we can load a ran model from the equation file."""
         csv_file_data = """
-        Complexity|MSE|Equation
-        1|0.19951081|1.9762075
-        3|0.12717344|(f0 + 1.4724599)
-        4|0.104823045|pow_abs(2.2683423, cos(f3))"""
         # Strip the indents:
         csv_file_data = "\n".join([l.strip() for l in csv_file_data.split("\n")])
@@ -379,7 +379,7 @@ class TestBest(unittest.TestCase):
         self.model.selection_mask_ = None
         self.model.feature_names_in_ = np.array(["x0", "x1"], dtype=object)
         equations["complexity loss equation".split(" ")].to_csv(
-            "equation_file.csv.bkup", sep="|"
         )
         self.model.refresh()

     def test_load_model(self):
         """See if we can load a ran model from the equation file."""
         csv_file_data = """
+        Complexity,Loss,Equation
+        1,0.19951081,"1.9762075"
+        3,0.12717344,"(f0 + 1.4724599)"
+        4,0.104823045,"pow_abs(2.2683423, cos(f3))\""""
         # Strip the indents:
         csv_file_data = "\n".join([l.strip() for l in csv_file_data.split("\n")])
         self.model.selection_mask_ = None
         self.model.feature_names_in_ = np.array(["x0", "x1"], dtype=object)
         equations["complexity loss equation".split(" ")].to_csv(
+            "equation_file.csv.bkup"
         )
         self.model.refresh()

test/test_jax.py CHANGED Viewed

@@ -34,13 +34,13 @@ class TestJAX(unittest.TestCase):
         equations = pd.DataFrame(
             {
                 "Equation": ["1.0", "cos(x1)", "square(cos(x1))"],
-                "MSE": [1.0, 0.1, 1e-5],
                 "Complexity": [1, 2, 3],
             }
         )
-        equations["Complexity MSE Equation".split(" ")].to_csv(
-            "equation_file.csv.bkup", sep="|"
         )
         model.refresh(checkpoint_file="equation_file.csv")
@@ -61,13 +61,13 @@ class TestJAX(unittest.TestCase):
         equations = pd.DataFrame(
             {
                 "Equation": ["1.0", "cos(x1)", "square(cos(x1))"],
-                "MSE": [1.0, 0.1, 1e-5],
                 "Complexity": [1, 2, 3],
             }
         )
-        equations["Complexity MSE Equation".split(" ")].to_csv(
-            "equation_file.csv.bkup", sep="|"
         )
         model.refresh(checkpoint_file="equation_file.csv")

         equations = pd.DataFrame(
             {
                 "Equation": ["1.0", "cos(x1)", "square(cos(x1))"],
+                "Loss": [1.0, 0.1, 1e-5],
                 "Complexity": [1, 2, 3],
             }
         )
+        equations["Complexity Loss Equation".split(" ")].to_csv(
+            "equation_file.csv.bkup"
         )
         model.refresh(checkpoint_file="equation_file.csv")
         equations = pd.DataFrame(
             {
                 "Equation": ["1.0", "cos(x1)", "square(cos(x1))"],
+                "Loss": [1.0, 0.1, 1e-5],
                 "Complexity": [1, 2, 3],
             }
         )
+        equations["Complexity Loss Equation".split(" ")].to_csv(
+            "equation_file.csv.bkup"
         )
         model.refresh(checkpoint_file="equation_file.csv")

test/test_torch.py CHANGED Viewed

@@ -49,13 +49,13 @@ class TestTorch(unittest.TestCase):
         equations = pd.DataFrame(
             {
                 "Equation": ["1.0", "cos(x1)", "square(cos(x1))"],
-                "MSE": [1.0, 0.1, 1e-5],
                 "Complexity": [1, 2, 3],
             }
         )
-        equations["Complexity MSE Equation".split(" ")].to_csv(
-            "equation_file.csv.bkup", sep="|"
         )
         model.refresh(checkpoint_file="equation_file.csv")
@@ -82,13 +82,13 @@ class TestTorch(unittest.TestCase):
         equations = pd.DataFrame(
             {
                 "Equation": ["1.0", "cos(x1)", "square(cos(x1))"],
-                "MSE": [1.0, 0.1, 1e-5],
                 "Complexity": [1, 2, 3],
             }
         )
-        equations["Complexity MSE Equation".split(" ")].to_csv(
-            "equation_file.csv.bkup", sep="|"
         )
         model.refresh(checkpoint_file="equation_file.csv")
@@ -133,13 +133,13 @@ class TestTorch(unittest.TestCase):
         equations = pd.DataFrame(
             {
                 "Equation": ["1.0", "mycustomoperator(x1)"],
-                "MSE": [1.0, 0.1],
                 "Complexity": [1, 2],
             }
         )
-        equations["Complexity MSE Equation".split(" ")].to_csv(
-            "equation_file_custom_operator.csv.bkup", sep="|"
         )
         model.set_params(

         equations = pd.DataFrame(
             {
                 "Equation": ["1.0", "cos(x1)", "square(cos(x1))"],
+                "Loss": [1.0, 0.1, 1e-5],
                 "Complexity": [1, 2, 3],
             }
         )
+        equations["Complexity Loss Equation".split(" ")].to_csv(
+            "equation_file.csv.bkup"
         )
         model.refresh(checkpoint_file="equation_file.csv")
         equations = pd.DataFrame(
             {
                 "Equation": ["1.0", "cos(x1)", "square(cos(x1))"],
+                "Loss": [1.0, 0.1, 1e-5],
                 "Complexity": [1, 2, 3],
             }
         )
+        equations["Complexity Loss Equation".split(" ")].to_csv(
+            "equation_file.csv.bkup"
         )
         model.refresh(checkpoint_file="equation_file.csv")
         equations = pd.DataFrame(
             {
                 "Equation": ["1.0", "mycustomoperator(x1)"],
+                "Loss": [1.0, 0.1],
                 "Complexity": [1, 2],
             }
         )
+        equations["Complexity Loss Equation".split(" ")].to_csv(
+            "equation_file_custom_operator.csv.bkup"
         )
         model.set_params(