tangluJay
/

test

Model card Files Files and versions Community

tanglumy commited on 17 days ago

Commit

1a6c70c

1 Parent(s): b0723db

initial commit of model weights

Browse files

Files changed (35) hide show

gpu_training/best_model.pt +3 -0
gpu_training/checkpoint_0.pt +3 -0
gpu_training/checkpoint_1000.pt +3 -0
gpu_training/checkpoint_2000.pt +3 -0
gpu_training/checkpoint_3000.pt +3 -0
gpu_training/checkpoint_4000.pt +3 -0
gpu_training/eval/.ipynb_checkpoints/evaluation_results-checkpoint.json +259 -0
gpu_training/eval/.ipynb_checkpoints/summary-checkpoint.txt +18 -0
gpu_training/eval/evaluation_results.json +70 -0
gpu_training/eval/summary.txt +18 -0
gpu_training/final_model.pt +3 -0
gpu_training/steering/.ipynb_checkpoints/metadata-checkpoint.json +138 -0
gpu_training/steering/metadata.json +138 -0
gpu_training/steering/steering_vectors.pt +3 -0
gpu_training_20250713_015232/steering/metadata.json +138 -0
gpu_training_20250713_015232/steering/steering_vectors.pt +3 -0
gpu_training_20250713_032436/steering/metadata.json +138 -0
gpu_training_20250713_032436/steering/steering_vectors.pt +3 -0
gpu_training_20250713_032744/steering/metadata.json +138 -0
gpu_training_20250713_032744/steering/steering_vectors.pt +3 -0
gpu_training_20250713_033240/best_model.pt +3 -0
gpu_training_20250713_033240/checkpoint_0.pt +3 -0
gpu_training_20250713_033240/checkpoint_1000.pt +3 -0
gpu_training_20250713_033240/checkpoint_1500.pt +3 -0
gpu_training_20250713_033240/checkpoint_2000.pt +3 -0
gpu_training_20250713_033240/checkpoint_2500.pt +3 -0
gpu_training_20250713_033240/checkpoint_3000.pt +3 -0
gpu_training_20250713_033240/checkpoint_3500.pt +3 -0
gpu_training_20250713_033240/checkpoint_4000.pt +3 -0
gpu_training_20250713_033240/checkpoint_4500.pt +3 -0
gpu_training_20250713_033240/checkpoint_500.pt +3 -0
gpu_training_20250713_033240/final_model.pt +3 -0
gpu_training_20250713_033240/steering/metadata.json +138 -0
gpu_training_20250713_033240/steering/steering_vectors.pt +3 -0
test_training/config.yaml +20 -0

gpu_training/best_model.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:688a56d0a26a85cd0803b7e2cbb05acc1b10e2127e1f28f4e8b3a8f48939121d
+size 78711093

gpu_training/checkpoint_0.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:af443be42ff0540419e818d2483aea756d099dbc224f0fee13d62efe1e63b48a
+size 78711137

gpu_training/checkpoint_1000.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2b928ecb85ef3e6bab044a2b8dcf6b7b95db79bf2840647edee71d9589488509
+size 78711203

gpu_training/checkpoint_2000.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:848923538b815fe33df8aa7784aeab07aec7ab8f38664af122fe8e8729abeec9
+size 78711203

gpu_training/checkpoint_3000.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b84249e6037c914ec54f680914b568d42988f91ca4ee4b38d8b97e26a6337828
+size 78711203

gpu_training/checkpoint_4000.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1c1b5fbcdbffe42f10f37889117d261fd0757308ba4bc7ce48f3966fd42b4740
+size 78711203

gpu_training/eval/.ipynb_checkpoints/evaluation_results-checkpoint.json ADDED Viewed

	@@ -0,0 +1,259 @@

+{
+  "gsm8k": {
+    "fr_ponder": {
+      "accuracy": 0.0,
+      "efficiency": {
+        "mean_flops": 1548841728.0,
+        "median_flops": 1278950400.0,
+        "std_flops": 2059376643.3027253,
+        "min_flops": 26234880.0,
+        "max_flops": 11031767040.0,
+        "total_flops": 309768345600.0
+      },
+      "speedup": {
+        "mean_time": 3.2877051854133605,
+        "median_time": 3.692348003387451,
+        "std_time": 3.2731626526056754,
+        "min_time": 0.08106875419616699,
+        "max_time": 11.631380319595337,
+        "total_time": 657.5410370826721
+      },
+      "avg_flops": 1548841728.0,
+      "avg_time": 3.2877051854133605,
+      "avg_steps": 118.075
+    },
+    "baseline": {
+      "accuracy": 0.24,
+      "efficiency": {
+        "mean_flops": 1264988628340.475,
+        "median_flops": 1300493380979.0,
+        "std_flops": 56453805454.47149,
+        "min_flops": 1050444988777.0,
+        "max_flops": 1300493380979.0,
+        "total_flops": 252997725668095.0
+      },
+      "speedup": {
+        "mean_time": 5.5069497311115265,
+        "median_time": 5.29523766040802,
+        "std_time": 2.5041656924556133,
+        "min_time": 0.25672364234924316,
+        "max_time": 8.91803526878357,
+        "total_time": 1101.3899462223053
+      },
+      "avg_flops": 1264988628340.475,
+      "avg_time": 5.5069497311115265
+    },
+    "alpha_sweep": {
+      "0.1": {
+        "accuracy": 0.26,
+        "efficiency": {
+          "mean_flops": 316247157084.55,
+          "median_flops": 325123345244.0,
+          "std_flops": 14113451363.45452,
+          "min_flops": 262611247194.0,
+          "max_flops": 325123345244.0,
+          "total_flops": 63249431416910.0
+        },
+        "speedup": {
+          "mean_time": 5.520822087526321,
+          "median_time": 5.165250658988953,
+          "std_time": 2.544426104881166,
+          "min_time": 0.5056312084197998,
+          "max_time": 8.917860269546509,
+          "total_time": 1104.1644175052643
+        },
+        "avg_flops": 316247157084.55,
+        "avg_time": 5.520822087526321
+      },
+      "0.2": {
+        "accuracy": 0.31,
+        "efficiency": {
+          "mean_flops": 632494314169.865,
+          "median_flops": 650246690489.0,
+          "std_flops": 28226902727.115955,
+          "min_flops": 525222494388.0,
+          "max_flops": 650246690489.0,
+          "total_flops": 126498862833973.0
+        },
+        "speedup": {
+          "mean_time": 5.471761356592179,
+          "median_time": 5.289220690727234,
+          "std_time": 2.4624447347559575,
+          "min_time": 0.5140595436096191,
+          "max_time": 8.949026346206665,
+          "total_time": 1094.3522713184357
+        },
+        "avg_flops": 632494314169.865,
+        "avg_time": 5.471761356592179
+      },
+      "0.3": {
+        "accuracy": 0.235,
+        "efficiency": {
+          "mean_flops": 948741471255.16,
+          "median_flops": 975370035734.0,
+          "std_flops": 42340354090.81005,
+          "min_flops": 787833741583.0,
+          "max_flops": 975370035734.0,
+          "total_flops": 189748294251032.0
+        },
+        "speedup": {
+          "mean_time": 5.410509116649628,
+          "median_time": 5.308708548545837,
+          "std_time": 2.347776937087377,
+          "min_time": 0.259929895401001,
+          "max_time": 8.930791139602661,
+          "total_time": 1082.1018233299255
+        },
+        "avg_flops": 948741471255.16,
+        "avg_time": 5.410509116649628
+      },
+      "0.4": {
+        "accuracy": 0.29,
+        "efficiency": {
+          "mean_flops": 1264988628340.475,
+          "median_flops": 1300493380979.0,
+          "std_flops": 56453805454.47149,
+          "min_flops": 1050444988777.0,
+          "max_flops": 1300493380979.0,
+          "total_flops": 252997725668095.0
+        },
+        "speedup": {
+          "mean_time": 5.346057170629502,
+          "median_time": 4.7032036781311035,
+          "std_time": 2.4986757843866743,
+          "min_time": 1.421558141708374,
+          "max_time": 8.93062448501587,
+          "total_time": 1069.2114341259003
+        },
+        "avg_flops": 1264988628340.475,
+        "avg_time": 5.346057170629502
+      },
+      "0.5": {
+        "accuracy": 0.26,
+        "efficiency": {
+          "mean_flops": 1581235785425.93,
+          "median_flops": 1625616726224.0,
+          "std_flops": 70567256817.9984,
+          "min_flops": 1313056235972.0,
+          "max_flops": 1625616726224.0,
+          "total_flops": 316247157085186.0
+        },
+        "speedup": {
+          "mean_time": 5.563114120960235,
+          "median_time": 5.053737163543701,
+          "std_time": 2.602014242594124,
+          "min_time": 1.132164478302002,
+          "max_time": 14.432584524154663,
+          "total_time": 1112.6228241920471
+        },
+        "avg_flops": 1581235785425.93,
+        "avg_time": 5.563114120960235
+      },
+      "0.6": {
+        "accuracy": 0.26,
+        "efficiency": {
+          "mean_flops": 1897482942510.48,
+          "median_flops": 1950740071468.0,
+          "std_flops": 84680708181.45291,
+          "min_flops": 1575667483166.0,
+          "max_flops": 1950740071468.0,
+          "total_flops": 379496588502096.0
+        },
+        "speedup": {
+          "mean_time": 5.5442887151241305,
+          "median_time": 5.442851781845093,
+          "std_time": 2.3669791337173227,
+          "min_time": 0.6514637470245361,
+          "max_time": 9.174688816070557,
+          "total_time": 1108.857743024826
+        },
+        "avg_flops": 1897482942510.48,
+        "avg_time": 5.5442887151241305
+      },
+      "0.7": {
+        "accuracy": 0.24,
+        "efficiency": {
+          "mean_flops": 2213730099595.73,
+          "median_flops": 2275863416713.0,
+          "std_flops": 98794159545.19882,
+          "min_flops": 1838278730360.0,
+          "max_flops": 2275863416713.0,
+          "total_flops": 442746019919146.0
+        },
+        "speedup": {
+          "mean_time": 5.172487876415253,
+          "median_time": 4.997930645942688,
+          "std_time": 2.330700061672161,
+          "min_time": 1.2688794136047363,
+          "max_time": 8.9685537815094,
+          "total_time": 1034.4975752830505
+        },
+        "avg_flops": 2213730099595.73,
+        "avg_time": 5.172487876415253
+      },
+      "0.8": {
+        "accuracy": 0.29,
+        "efficiency": {
+          "mean_flops": 2529977256681.09,
+          "median_flops": 2600986761958.0,
+          "std_flops": 112907610908.80844,
+          "min_flops": 2100889977555.0,
+          "max_flops": 2600986761958.0,
+          "total_flops": 505995451336218.0
+        },
+        "speedup": {
+          "mean_time": 5.460249330997467,
+          "median_time": 5.191383481025696,
+          "std_time": 2.320604780645787,
+          "min_time": 0.48939085006713867,
+          "max_time": 8.930345058441162,
+          "total_time": 1092.0498661994934
+        },
+        "avg_flops": 2529977256681.09,
+        "avg_time": 5.460249330997467
+      },
+      "0.9": {
+        "accuracy": 0.29,
+        "efficiency": {
+          "mean_flops": 2846224413766.405,
+          "median_flops": 2926110107203.0,
+          "std_flops": 127021062272.46988,
+          "min_flops": 2363501224749.0,
+          "max_flops": 2926110107203.0,
+          "total_flops": 569244882753281.0
+        },
+        "speedup": {
+          "mean_time": 5.496963980197907,
+          "median_time": 5.254109740257263,
+          "std_time": 2.4695009865065334,
+          "min_time": 0.5802221298217773,
+          "max_time": 8.95212435722351,
+          "total_time": 1099.3927960395813
+        },
+        "avg_flops": 2846224413766.405,
+        "avg_time": 5.496963980197907
+      },
+      "1.0": {
+        "accuracy": 0.28,
+        "efficiency": {
+          "mean_flops": 3162471570851.86,
+          "median_flops": 3251233452448.0,
+          "std_flops": 141134513635.9968,
+          "min_flops": 2626112471944.0,
+          "max_flops": 3251233452448.0,
+          "total_flops": 632494314170372.0
+        },
+        "speedup": {
+          "mean_time": 5.370402137041092,
+          "median_time": 5.241830468177795,
+          "std_time": 2.5148718604922156,
+          "min_time": 0.1468040943145752,
+          "max_time": 14.612837076187134,
+          "total_time": 1074.0804274082184
+        },
+        "avg_flops": 3162471570851.86,
+        "avg_time": 5.370402137041092
+      }
+    }
+  }
+}

gpu_training/eval/.ipynb_checkpoints/summary-checkpoint.txt ADDED Viewed

	@@ -0,0 +1,18 @@

+FR-Ponder Evaluation Results
+==============================
+Dataset: gsm8k
+--------------------
+FR-Ponder:
+  Accuracy: 0.000
+  Avg FLOPs: 1548841728
+  Avg Time: 3.288s
+  Avg Steps: 118.1
+Baseline (α=0.4):
+  Accuracy: 0.240
+  Avg FLOPs: 1264988628340
+  Avg Time: 5.507s
+Improvements:
+  Accuracy: +-0.240
+  FLOPs reduction: 99.9%
+  Speedup: 1.68x

gpu_training/eval/evaluation_results.json ADDED Viewed

	@@ -0,0 +1,70 @@

+{
+  "gsm8k": {
+    "fr_ponder": {
+      "accuracy": 0.0,
+      "efficiency": {
+        "mean_flops": 1368148992.0,
+        "median_flops": 1554416640.0,
+        "std_flops": 1617190973.1658711,
+        "min_flops": 26234880.0,
+        "max_flops": 8591923200.0,
+        "total_flops": 136814899200.0
+      },
+      "speedup": {
+        "mean_time": 3.323502082824707,
+        "median_time": 4.929964542388916,
+        "std_time": 3.102591789855366,
+        "min_time": 0.08603239059448242,
+        "max_time": 9.481685638427734,
+        "total_time": 332.3502082824707
+      },
+      "avg_flops": 1368148992.0,
+      "avg_time": 3.323502082824707,
+      "avg_steps": 104.3
+    },
+    "baseline": {
+      "accuracy": 0.25,
+      "efficiency": {
+        "mean_flops": 1259616826016.48,
+        "median_flops": 1300493380979.0,
+        "std_flops": 61378209282.38763,
+        "min_flops": 1050444988777.0,
+        "max_flops": 1300493380979.0,
+        "total_flops": 125961682601648.0
+      },
+      "speedup": {
+        "mean_time": 5.597262227535248,
+        "median_time": 5.318989992141724,
+        "std_time": 2.637104224359403,
+        "min_time": 0.9660005569458008,
+        "max_time": 9.206240177154541,
+        "total_time": 559.7262227535248
+      },
+      "avg_flops": 1259616826016.48,
+      "avg_time": 5.597262227535248
+    },
+    "alpha_sweep": {
+      "0.1": {
+        "accuracy": 0.25,
+        "efficiency": {
+          "mean_flops": 314904206503.56,
+          "median_flops": 325123345244.0,
+          "std_flops": 15344552320.43663,
+          "min_flops": 262611247194.0,
+          "max_flops": 325123345244.0,
+          "total_flops": 31490420650356.0
+        },
+        "speedup": {
+          "mean_time": 5.451106414794922,
+          "median_time": 5.010058760643005,
+          "std_time": 2.636969014137301,
+          "min_time": 1.0382819175720215,
+          "max_time": 9.177106380462646,
+          "total_time": 545.1106414794922
+        },
+        "avg_flops": 314904206503.56,
+        "avg_time": 5.451106414794922
+      }
+    }
+  }
+}

gpu_training/eval/summary.txt ADDED Viewed

	@@ -0,0 +1,18 @@

+FR-Ponder Evaluation Results
+==============================
+Dataset: gsm8k
+--------------------
+FR-Ponder:
+  Accuracy: 0.000
+  Avg FLOPs: 1368148992
+  Avg Time: 3.324s
+  Avg Steps: 104.3
+Baseline (α=0.4):
+  Accuracy: 0.250
+  Avg FLOPs: 1259616826016
+  Avg Time: 5.597s
+Improvements:
+  Accuracy: +-0.250
+  FLOPs reduction: 99.9%
+  Speedup: 1.68x

gpu_training/final_model.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dc472ffda208b92c7857cb93c678981d07992e0ee79ce12ac7c09f818effafef
+size 78711115

gpu_training/steering/.ipynb_checkpoints/metadata-checkpoint.json ADDED Viewed

	@@ -0,0 +1,138 @@

+{
+  "model_name": "microsoft/phi-2",
+  "positive_prompt": "Think step-by-step",
+  "negative_prompt": "Direct answer",
+  "layer_indices": [
+    0,
+    1,
+    2,
+    3,
+    4,
+    5,
+    6,
+    7,
+    8,
+    9,
+    10,
+    11,
+    12,
+    13,
+    14,
+    15,
+    16,
+    17,
+    18,
+    19,
+    20,
+    21,
+    22,
+    23,
+    24,
+    25,
+    26,
+    27,
+    28,
+    29,
+    30,
+    31
+  ],
+  "num_samples": 500,
+  "vector_shapes": {
+    "0": [
+      2560
+    ],
+    "1": [
+      2560
+    ],
+    "2": [
+      2560
+    ],
+    "3": [
+      2560
+    ],
+    "4": [
+      2560
+    ],
+    "5": [
+      2560
+    ],
+    "6": [
+      2560
+    ],
+    "7": [
+      2560
+    ],
+    "8": [
+      2560
+    ],
+    "9": [
+      2560
+    ],
+    "10": [
+      2560
+    ],
+    "11": [
+      2560
+    ],
+    "12": [
+      2560
+    ],
+    "13": [
+      2560
+    ],
+    "14": [
+      2560
+    ],
+    "15": [
+      2560
+    ],
+    "16": [
+      2560
+    ],
+    "17": [
+      2560
+    ],
+    "18": [
+      2560
+    ],
+    "19": [
+      2560
+    ],
+    "20": [
+      2560
+    ],
+    "21": [
+      2560
+    ],
+    "22": [
+      2560
+    ],
+    "23": [
+      2560
+    ],
+    "24": [
+      2560
+    ],
+    "25": [
+      2560
+    ],
+    "26": [
+      2560
+    ],
+    "27": [
+      2560
+    ],
+    "28": [
+      2560
+    ],
+    "29": [
+      2560
+    ],
+    "30": [
+      2560
+    ],
+    "31": [
+      2560
+    ]
+  }
+}

gpu_training/steering/metadata.json ADDED Viewed

	@@ -0,0 +1,138 @@

+{
+  "model_name": "microsoft/phi-2",
+  "positive_prompt": "Think step-by-step",
+  "negative_prompt": "Direct answer",
+  "layer_indices": [
+    0,
+    1,
+    2,
+    3,
+    4,
+    5,
+    6,
+    7,
+    8,
+    9,
+    10,
+    11,
+    12,
+    13,
+    14,
+    15,
+    16,
+    17,
+    18,
+    19,
+    20,
+    21,
+    22,
+    23,
+    24,
+    25,
+    26,
+    27,
+    28,
+    29,
+    30,
+    31
+  ],
+  "num_samples": 500,
+  "vector_shapes": {
+    "0": [
+      2560
+    ],
+    "1": [
+      2560
+    ],
+    "2": [
+      2560
+    ],
+    "3": [
+      2560
+    ],
+    "4": [
+      2560
+    ],
+    "5": [
+      2560
+    ],
+    "6": [
+      2560
+    ],
+    "7": [
+      2560
+    ],
+    "8": [
+      2560
+    ],
+    "9": [
+      2560
+    ],
+    "10": [
+      2560
+    ],
+    "11": [
+      2560
+    ],
+    "12": [
+      2560
+    ],
+    "13": [
+      2560
+    ],
+    "14": [
+      2560
+    ],
+    "15": [
+      2560
+    ],
+    "16": [
+      2560
+    ],
+    "17": [
+      2560
+    ],
+    "18": [
+      2560
+    ],
+    "19": [
+      2560
+    ],
+    "20": [
+      2560
+    ],
+    "21": [
+      2560
+    ],
+    "22": [
+      2560
+    ],
+    "23": [
+      2560
+    ],
+    "24": [
+      2560
+    ],
+    "25": [
+      2560
+    ],
+    "26": [
+      2560
+    ],
+    "27": [
+      2560
+    ],
+    "28": [
+      2560
+    ],
+    "29": [
+      2560
+    ],
+    "30": [
+      2560
+    ],
+    "31": [
+      2560
+    ]
+  }
+}

gpu_training/steering/steering_vectors.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bac198bb75f847f9bc6af2e86fdce994463d1db08b9cc42ed8c06beb05b52d0a
+size 173273

gpu_training_20250713_015232/steering/metadata.json ADDED Viewed

	@@ -0,0 +1,138 @@

+{
+  "model_name": "microsoft/phi-2",
+  "positive_prompt": "Think step-by-step",
+  "negative_prompt": "Direct answer",
+  "layer_indices": [
+    0,
+    1,
+    2,
+    3,
+    4,
+    5,
+    6,
+    7,
+    8,
+    9,
+    10,
+    11,
+    12,
+    13,
+    14,
+    15,
+    16,
+    17,
+    18,
+    19,
+    20,
+    21,
+    22,
+    23,
+    24,
+    25,
+    26,
+    27,
+    28,
+    29,
+    30,
+    31
+  ],
+  "num_samples": 200,
+  "vector_shapes": {
+    "0": [
+      2560
+    ],
+    "1": [
+      2560
+    ],
+    "2": [
+      2560
+    ],
+    "3": [
+      2560
+    ],
+    "4": [
+      2560
+    ],
+    "5": [
+      2560
+    ],
+    "6": [
+      2560
+    ],
+    "7": [
+      2560
+    ],
+    "8": [
+      2560
+    ],
+    "9": [
+      2560
+    ],
+    "10": [
+      2560
+    ],
+    "11": [
+      2560
+    ],
+    "12": [
+      2560
+    ],
+    "13": [
+      2560
+    ],
+    "14": [
+      2560
+    ],
+    "15": [
+      2560
+    ],
+    "16": [
+      2560
+    ],
+    "17": [
+      2560
+    ],
+    "18": [
+      2560
+    ],
+    "19": [
+      2560
+    ],
+    "20": [
+      2560
+    ],
+    "21": [
+      2560
+    ],
+    "22": [
+      2560
+    ],
+    "23": [
+      2560
+    ],
+    "24": [
+      2560
+    ],
+    "25": [
+      2560
+    ],
+    "26": [
+      2560
+    ],
+    "27": [
+      2560
+    ],
+    "28": [
+      2560
+    ],
+    "29": [
+      2560
+    ],
+    "30": [
+      2560
+    ],
+    "31": [
+      2560
+    ]
+  }
+}

gpu_training_20250713_015232/steering/steering_vectors.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bac198bb75f847f9bc6af2e86fdce994463d1db08b9cc42ed8c06beb05b52d0a
+size 173273

gpu_training_20250713_032436/steering/metadata.json ADDED Viewed

	@@ -0,0 +1,138 @@

+{
+  "model_name": "microsoft/phi-2",
+  "positive_prompt": "Think step-by-step",
+  "negative_prompt": "Direct answer",
+  "layer_indices": [
+    0,
+    1,
+    2,
+    3,
+    4,
+    5,
+    6,
+    7,
+    8,
+    9,
+    10,
+    11,
+    12,
+    13,
+    14,
+    15,
+    16,
+    17,
+    18,
+    19,
+    20,
+    21,
+    22,
+    23,
+    24,
+    25,
+    26,
+    27,
+    28,
+    29,
+    30,
+    31
+  ],
+  "num_samples": 200,
+  "vector_shapes": {
+    "0": [
+      2560
+    ],
+    "1": [
+      2560
+    ],
+    "2": [
+      2560
+    ],
+    "3": [
+      2560
+    ],
+    "4": [
+      2560
+    ],
+    "5": [
+      2560
+    ],
+    "6": [
+      2560
+    ],
+    "7": [
+      2560
+    ],
+    "8": [
+      2560
+    ],
+    "9": [
+      2560
+    ],
+    "10": [
+      2560
+    ],
+    "11": [
+      2560
+    ],
+    "12": [
+      2560
+    ],
+    "13": [
+      2560
+    ],
+    "14": [
+      2560
+    ],
+    "15": [
+      2560
+    ],
+    "16": [
+      2560
+    ],
+    "17": [
+      2560
+    ],
+    "18": [
+      2560
+    ],
+    "19": [
+      2560
+    ],
+    "20": [
+      2560
+    ],
+    "21": [
+      2560
+    ],
+    "22": [
+      2560
+    ],
+    "23": [
+      2560
+    ],
+    "24": [
+      2560
+    ],
+    "25": [
+      2560
+    ],
+    "26": [
+      2560
+    ],
+    "27": [
+      2560
+    ],
+    "28": [
+      2560
+    ],
+    "29": [
+      2560
+    ],
+    "30": [
+      2560
+    ],
+    "31": [
+      2560
+    ]
+  }
+}

gpu_training_20250713_032436/steering/steering_vectors.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bac198bb75f847f9bc6af2e86fdce994463d1db08b9cc42ed8c06beb05b52d0a
+size 173273

gpu_training_20250713_032744/steering/metadata.json ADDED Viewed

	@@ -0,0 +1,138 @@

+{
+  "model_name": "microsoft/phi-2",
+  "positive_prompt": "Think step-by-step",
+  "negative_prompt": "Direct answer",
+  "layer_indices": [
+    0,
+    1,
+    2,
+    3,
+    4,
+    5,
+    6,
+    7,
+    8,
+    9,
+    10,
+    11,
+    12,
+    13,
+    14,
+    15,
+    16,
+    17,
+    18,
+    19,
+    20,
+    21,
+    22,
+    23,
+    24,
+    25,
+    26,
+    27,
+    28,
+    29,
+    30,
+    31
+  ],
+  "num_samples": 200,
+  "vector_shapes": {
+    "0": [
+      2560
+    ],
+    "1": [
+      2560
+    ],
+    "2": [
+      2560
+    ],
+    "3": [
+      2560
+    ],
+    "4": [
+      2560
+    ],
+    "5": [
+      2560
+    ],
+    "6": [
+      2560
+    ],
+    "7": [
+      2560
+    ],
+    "8": [
+      2560
+    ],
+    "9": [
+      2560
+    ],
+    "10": [
+      2560
+    ],
+    "11": [
+      2560
+    ],
+    "12": [
+      2560
+    ],
+    "13": [
+      2560
+    ],
+    "14": [
+      2560
+    ],
+    "15": [
+      2560
+    ],
+    "16": [
+      2560
+    ],
+    "17": [
+      2560
+    ],
+    "18": [
+      2560
+    ],
+    "19": [
+      2560
+    ],
+    "20": [
+      2560
+    ],
+    "21": [
+      2560
+    ],
+    "22": [
+      2560
+    ],
+    "23": [
+      2560
+    ],
+    "24": [
+      2560
+    ],
+    "25": [
+      2560
+    ],
+    "26": [
+      2560
+    ],
+    "27": [
+      2560
+    ],
+    "28": [
+      2560
+    ],
+    "29": [
+      2560
+    ],
+    "30": [
+      2560
+    ],
+    "31": [
+      2560
+    ]
+  }
+}

gpu_training_20250713_032744/steering/steering_vectors.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bac198bb75f847f9bc6af2e86fdce994463d1db08b9cc42ed8c06beb05b52d0a
+size 173273

gpu_training_20250713_033240/best_model.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6b2b8b264b481c80321b472a015526a6f1568ae5a9c803e64b01d3831b804234
+size 34999

gpu_training_20250713_033240/checkpoint_0.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:49ec15a40042441da104a18c39f176444df227cfd6c5cb778e5a017378ca3401
+size 35027

gpu_training_20250713_033240/checkpoint_1000.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:21296f1af03377cff6d38d4d013e088c0ca1f176851efe4ee78137dc101060d0
+size 35069

gpu_training_20250713_033240/checkpoint_1500.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:80561d8da90baad0faf297824f652fa2c0e9ad70c74baf8888adde51b0928942
+size 35069

gpu_training_20250713_033240/checkpoint_2000.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:69fe1baa2fc525b66688aef7ae9ed73b78bcc85a2b3d728b84d309fc6b6e3b95
+size 35069

gpu_training_20250713_033240/checkpoint_2500.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cb8abdcdf4b763446c4492eb3a3b8dd39612ae9090c3dbc704d31bb93a93d0a8
+size 35069

gpu_training_20250713_033240/checkpoint_3000.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4ac5de4471b67f24536f5a0a89fb982b21bd1d6c821bec2b6a47752f791e5ade
+size 35069

gpu_training_20250713_033240/checkpoint_3500.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:88a8249a0039cd77449f0e96f4c48211c109ac39d1e58ba03faf771be61dce50
+size 35069

gpu_training_20250713_033240/checkpoint_4000.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:01beb87333b14a081390eb537c3b07e8a062813b1720b5ae083ae9fa39e16ce5
+size 35069

gpu_training_20250713_033240/checkpoint_4500.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4b72e5b7ad37abac40dde41f23ab7f2fde514d6d8f51d45ab90b3cff173255a9
+size 35069

gpu_training_20250713_033240/checkpoint_500.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8c3d08cca746929883326ac36055ec13bbd7c5e64d7a7512bfe86495f6c21829
+size 35055

gpu_training_20250713_033240/final_model.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7caff9c0fe2f9b3bf912ee52396392d53eaa8c817f78dadbd80f6fa884a128d1
+size 35013

gpu_training_20250713_033240/steering/metadata.json ADDED Viewed

	@@ -0,0 +1,138 @@

+{
+  "model_name": "microsoft/phi-2",
+  "positive_prompt": "Think step-by-step",
+  "negative_prompt": "Direct answer",
+  "layer_indices": [
+    0,
+    1,
+    2,
+    3,
+    4,
+    5,
+    6,
+    7,
+    8,
+    9,
+    10,
+    11,
+    12,
+    13,
+    14,
+    15,
+    16,
+    17,
+    18,
+    19,
+    20,
+    21,
+    22,
+    23,
+    24,
+    25,
+    26,
+    27,
+    28,
+    29,
+    30,
+    31
+  ],
+  "num_samples": 200,
+  "vector_shapes": {
+    "0": [
+      2560
+    ],
+    "1": [
+      2560
+    ],
+    "2": [
+      2560
+    ],
+    "3": [
+      2560
+    ],
+    "4": [
+      2560
+    ],
+    "5": [
+      2560
+    ],
+    "6": [
+      2560
+    ],
+    "7": [
+      2560
+    ],
+    "8": [
+      2560
+    ],
+    "9": [
+      2560
+    ],
+    "10": [
+      2560
+    ],
+    "11": [
+      2560
+    ],
+    "12": [
+      2560
+    ],
+    "13": [
+      2560
+    ],
+    "14": [
+      2560
+    ],
+    "15": [
+      2560
+    ],
+    "16": [
+      2560
+    ],
+    "17": [
+      2560
+    ],
+    "18": [
+      2560
+    ],
+    "19": [
+      2560
+    ],
+    "20": [
+      2560
+    ],
+    "21": [
+      2560
+    ],
+    "22": [
+      2560
+    ],
+    "23": [
+      2560
+    ],
+    "24": [
+      2560
+    ],
+    "25": [
+      2560
+    ],
+    "26": [
+      2560
+    ],
+    "27": [
+      2560
+    ],
+    "28": [
+      2560
+    ],
+    "29": [
+      2560
+    ],
+    "30": [
+      2560
+    ],
+    "31": [
+      2560
+    ]
+  }
+}

gpu_training_20250713_033240/steering/steering_vectors.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bac198bb75f847f9bc6af2e86fdce994463d1db08b9cc42ed8c06beb05b52d0a
+size 173273

test_training/config.yaml ADDED Viewed

	@@ -0,0 +1,20 @@

+batch_size: 2
+controller_dropout: 0.1
+controller_layers: 2
+controller_lr: 0.0001
+dataset_name: gsm8k
+epochs: 1
+eval_baseline: true
+eval_interval: 1
+eval_samples: 5
+hidden_size: 2560
+lambda_accuracy: 1.0
+lambda_flops: 0.005
+log_interval: 10
+max_ponder_steps: 3
+model_name: microsoft/phi-2
+output_dir: outputs/test_training
+save_interval: 1
+threshold: 0.3
+train_samples: 10
+warmup_steps: 100