🍻 cheers

Browse files

Files changed (7) hide show

README.md +10 -6
all_results.json +16 -0
config.json +1 -1
eval_results.json +12 -0
runs/Mar12_11-48-01_datavisu4/events.out.tfevents.1710311640.datavisu4.62295.1 +3 -0
train_results.json +8 -0
trainer_state.json +779 -0

README.md CHANGED Viewed

@@ -1,7 +1,11 @@
 ---
 license: apache-2.0
 base_model: microsoft/resnet-50
 tags:
 - generated_from_trainer
 metrics:
 - accuracy
@@ -15,13 +19,13 @@ should probably proofread and complete it, then remove this comment. -->
 # resnet-50-linearhead-2024_03_12-with_data_aug_batch-size32_epochs93_freeze
-This model is a fine-tuned version of [microsoft/resnet-50](https://huggingface.co/microsoft/resnet-50) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.1546
-- F1 Micro: 0.7452
-- F1 Macro: 0.6223
-- Roc Auc: 0.8208
-- Accuracy: 0.4050
 - Learning Rate: 1e-05
 ## Model description

 ---
+language:
+- eng
 license: apache-2.0
 base_model: microsoft/resnet-50
 tags:
+- multilabel-image-classification
+- multilabel
 - generated_from_trainer
 metrics:
 - accuracy
 # resnet-50-linearhead-2024_03_12-with_data_aug_batch-size32_epochs93_freeze
+This model is a fine-tuned version of [microsoft/resnet-50](https://huggingface.co/microsoft/resnet-50) on the multilabel_complete_dataset dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.1518
+- F1 Micro: 0.7545
+- F1 Macro: 0.6309
+- Roc Auc: 0.8276
+- Accuracy: 0.4069
 - Learning Rate: 1e-05
 ## Model description

all_results.json ADDED Viewed

	@@ -0,0 +1,16 @@

+{
+    "epoch": 46.0,
+    "eval_accuracy": 0.40687478077867417,
+    "eval_f1_macro": 0.6308665357852737,
+    "eval_f1_micro": 0.7544523735650016,
+    "eval_loss": 0.15177054703235626,
+    "eval_roc_auc": 0.8275818899442217,
+    "eval_runtime": 368.9147,
+    "eval_samples_per_second": 7.728,
+    "eval_steps_per_second": 0.244,
+    "learning_rate": 1e-05,
+    "train_loss": 0.1827572128274107,
+    "train_runtime": 70769.3212,
+    "train_samples_per_second": 11.517,
+    "train_steps_per_second": 0.36
+}

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "microsoft/resnet-50",
   "architectures": [
     "ResNetForImageClassification"
   ],

 {
+  "_name_or_path": "microsoft/resnet-502024_03_12",
   "architectures": [
     "ResNetForImageClassification"
   ],

eval_results.json ADDED Viewed

	@@ -0,0 +1,12 @@

+{
+    "epoch": 46.0,
+    "eval_accuracy": 0.40687478077867417,
+    "eval_f1_macro": 0.6308665357852737,
+    "eval_f1_micro": 0.7544523735650016,
+    "eval_loss": 0.15177054703235626,
+    "eval_roc_auc": 0.8275818899442217,
+    "eval_runtime": 368.9147,
+    "eval_samples_per_second": 7.728,
+    "eval_steps_per_second": 0.244,
+    "learning_rate": 1e-05
+}

runs/Mar12_11-48-01_datavisu4/events.out.tfevents.1710311640.datavisu4.62295.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f1a62462d2e0eea6e5dfabdb1d9f3e70881b3db0f6c29348f071465f035653cb
+size 624

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 46.0,
+    "learning_rate": 1e-05,
+    "train_loss": 0.1827572128274107,
+    "train_runtime": 70769.3212,
+    "train_samples_per_second": 11.517,
+    "train_steps_per_second": 0.36
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,779 @@

+{
+  "best_metric": 0.15303632616996765,
+  "best_model_checkpoint": "/home1/datawork/mcontini/models/multilabel/huggingface/resnet-50-linearhead-2024_03_12-with_data_aug_batch-size32_epochs93_freeze/checkpoint-9864",
+  "epoch": 46.0,
+  "eval_steps": 500,
+  "global_step": 12604,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.1951983298538622,
+      "eval_f1_macro": 0.2834407731254271,
+      "eval_f1_micro": 0.5838964773544213,
+      "eval_loss": 0.22367511689662933,
+      "eval_roc_auc": 0.71756579506086,
+      "eval_runtime": 377.3279,
+      "eval_samples_per_second": 7.617,
+      "eval_steps_per_second": 0.239,
+      "learning_rate": 0.001,
+      "step": 274
+    },
+    {
+      "epoch": 1.82,
+      "learning_rate": 0.001,
+      "loss": 0.2683,
+      "step": 500
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.30549756437021575,
+      "eval_f1_macro": 0.4548607736351322,
+      "eval_f1_micro": 0.67727182342414,
+      "eval_loss": 0.18945501744747162,
+      "eval_roc_auc": 0.7743387387654568,
+      "eval_runtime": 387.1639,
+      "eval_samples_per_second": 7.423,
+      "eval_steps_per_second": 0.232,
+      "learning_rate": 0.001,
+      "step": 548
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.35386221294363257,
+      "eval_f1_macro": 0.5202190109990653,
+      "eval_f1_micro": 0.7020794195763426,
+      "eval_loss": 0.17864234745502472,
+      "eval_roc_auc": 0.7911168944948984,
+      "eval_runtime": 391.2444,
+      "eval_samples_per_second": 7.346,
+      "eval_steps_per_second": 0.23,
+      "learning_rate": 0.001,
+      "step": 822
+    },
+    {
+      "epoch": 3.65,
+      "learning_rate": 0.001,
+      "loss": 0.2058,
+      "step": 1000
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.36673625608907445,
+      "eval_f1_macro": 0.5666424404021909,
+      "eval_f1_micro": 0.7198384654215043,
+      "eval_loss": 0.17152228951454163,
+      "eval_roc_auc": 0.8057974071888091,
+      "eval_runtime": 384.9412,
+      "eval_samples_per_second": 7.466,
+      "eval_steps_per_second": 0.234,
+      "learning_rate": 0.001,
+      "step": 1096
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.3768267223382046,
+      "eval_f1_macro": 0.5718368144674506,
+      "eval_f1_micro": 0.7220207418718584,
+      "eval_loss": 0.16623608767986298,
+      "eval_roc_auc": 0.8049842310066343,
+      "eval_runtime": 384.6479,
+      "eval_samples_per_second": 7.472,
+      "eval_steps_per_second": 0.234,
+      "learning_rate": 0.001,
+      "step": 1370
+    },
+    {
+      "epoch": 5.47,
+      "learning_rate": 0.001,
+      "loss": 0.1916,
+      "step": 1500
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.37961029923451634,
+      "eval_f1_macro": 0.5721081100676888,
+      "eval_f1_micro": 0.715496603041087,
+      "eval_loss": 0.16475693881511688,
+      "eval_roc_auc": 0.7979565909429278,
+      "eval_runtime": 379.9116,
+      "eval_samples_per_second": 7.565,
+      "eval_steps_per_second": 0.237,
+      "learning_rate": 0.001,
+      "step": 1644
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 0.38100208768267224,
+      "eval_f1_macro": 0.5973146797781492,
+      "eval_f1_micro": 0.7280701754385965,
+      "eval_loss": 0.16181063652038574,
+      "eval_roc_auc": 0.808226921681461,
+      "eval_runtime": 378.5774,
+      "eval_samples_per_second": 7.592,
+      "eval_steps_per_second": 0.238,
+      "learning_rate": 0.001,
+      "step": 1918
+    },
+    {
+      "epoch": 7.3,
+      "learning_rate": 0.001,
+      "loss": 0.1858,
+      "step": 2000
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.38552540013917885,
+      "eval_f1_macro": 0.6061015606132648,
+      "eval_f1_micro": 0.737494522005885,
+      "eval_loss": 0.15984570980072021,
+      "eval_roc_auc": 0.8165736033401827,
+      "eval_runtime": 373.9089,
+      "eval_samples_per_second": 7.686,
+      "eval_steps_per_second": 0.241,
+      "learning_rate": 0.001,
+      "step": 2192
+    },
+    {
+      "epoch": 9.0,
+      "eval_accuracy": 0.39109255393180237,
+      "eval_f1_macro": 0.6209440717973264,
+      "eval_f1_micro": 0.7440332279461905,
+      "eval_loss": 0.15988709032535553,
+      "eval_roc_auc": 0.8223085810562136,
+      "eval_runtime": 382.5296,
+      "eval_samples_per_second": 7.513,
+      "eval_steps_per_second": 0.235,
+      "learning_rate": 0.001,
+      "step": 2466
+    },
+    {
+      "epoch": 9.12,
+      "learning_rate": 0.001,
+      "loss": 0.1839,
+      "step": 2500
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy": 0.394919972164231,
+      "eval_f1_macro": 0.6047260524666048,
+      "eval_f1_micro": 0.7382172771596449,
+      "eval_loss": 0.15841498970985413,
+      "eval_roc_auc": 0.8173181533125079,
+      "eval_runtime": 384.4811,
+      "eval_samples_per_second": 7.475,
+      "eval_steps_per_second": 0.234,
+      "learning_rate": 0.001,
+      "step": 2740
+    },
+    {
+      "epoch": 10.95,
+      "learning_rate": 0.001,
+      "loss": 0.1815,
+      "step": 3000
+    },
+    {
+      "epoch": 11.0,
+      "eval_accuracy": 0.3959638135003479,
+      "eval_f1_macro": 0.6067885073789792,
+      "eval_f1_micro": 0.7413944173238203,
+      "eval_loss": 0.15687702596187592,
+      "eval_roc_auc": 0.8186288501697149,
+      "eval_runtime": 378.7669,
+      "eval_samples_per_second": 7.588,
+      "eval_steps_per_second": 0.238,
+      "learning_rate": 0.001,
+      "step": 3014
+    },
+    {
+      "epoch": 12.0,
+      "eval_accuracy": 0.39631176061238693,
+      "eval_f1_macro": 0.5952620618269702,
+      "eval_f1_micro": 0.7257172262961533,
+      "eval_loss": 0.15848152339458466,
+      "eval_roc_auc": 0.8043142106532862,
+      "eval_runtime": 379.0677,
+      "eval_samples_per_second": 7.582,
+      "eval_steps_per_second": 0.237,
+      "learning_rate": 0.001,
+      "step": 3288
+    },
+    {
+      "epoch": 12.77,
+      "learning_rate": 0.001,
+      "loss": 0.1807,
+      "step": 3500
+    },
+    {
+      "epoch": 13.0,
+      "eval_accuracy": 0.3966597077244259,
+      "eval_f1_macro": 0.6286378372829055,
+      "eval_f1_micro": 0.7513671162960261,
+      "eval_loss": 0.1580551415681839,
+      "eval_roc_auc": 0.8311449619256275,
+      "eval_runtime": 381.6295,
+      "eval_samples_per_second": 7.531,
+      "eval_steps_per_second": 0.236,
+      "learning_rate": 0.001,
+      "step": 3562
+    },
+    {
+      "epoch": 14.0,
+      "eval_accuracy": 0.4022268615170494,
+      "eval_f1_macro": 0.6230252873319017,
+      "eval_f1_micro": 0.7452783300198808,
+      "eval_loss": 0.15653984248638153,
+      "eval_roc_auc": 0.8224100131959987,
+      "eval_runtime": 376.7587,
+      "eval_samples_per_second": 7.628,
+      "eval_steps_per_second": 0.239,
+      "learning_rate": 0.001,
+      "step": 3836
+    },
+    {
+      "epoch": 14.6,
+      "learning_rate": 0.001,
+      "loss": 0.1795,
+      "step": 4000
+    },
+    {
+      "epoch": 15.0,
+      "eval_accuracy": 0.3990953375086987,
+      "eval_f1_macro": 0.6252632316687944,
+      "eval_f1_micro": 0.750355574794385,
+      "eval_loss": 0.1549140363931656,
+      "eval_roc_auc": 0.8261687325810277,
+      "eval_runtime": 378.8075,
+      "eval_samples_per_second": 7.587,
+      "eval_steps_per_second": 0.238,
+      "learning_rate": 0.001,
+      "step": 4110
+    },
+    {
+      "epoch": 16.0,
+      "eval_accuracy": 0.3938761308281141,
+      "eval_f1_macro": 0.6290292313985378,
+      "eval_f1_micro": 0.7446265030216187,
+      "eval_loss": 0.15725594758987427,
+      "eval_roc_auc": 0.8213875460516582,
+      "eval_runtime": 387.9526,
+      "eval_samples_per_second": 7.408,
+      "eval_steps_per_second": 0.232,
+      "learning_rate": 0.001,
+      "step": 4384
+    },
+    {
+      "epoch": 16.42,
+      "learning_rate": 0.001,
+      "loss": 0.178,
+      "step": 4500
+    },
+    {
+      "epoch": 17.0,
+      "eval_accuracy": 0.4025748086290884,
+      "eval_f1_macro": 0.6286656277196884,
+      "eval_f1_micro": 0.7519389388157086,
+      "eval_loss": 0.15514959394931793,
+      "eval_roc_auc": 0.8281482042533274,
+      "eval_runtime": 380.4468,
+      "eval_samples_per_second": 7.554,
+      "eval_steps_per_second": 0.237,
+      "learning_rate": 0.001,
+      "step": 4658
+    },
+    {
+      "epoch": 18.0,
+      "eval_accuracy": 0.3914405010438413,
+      "eval_f1_macro": 0.6155101525089491,
+      "eval_f1_micro": 0.7430460271922166,
+      "eval_loss": 0.15699204802513123,
+      "eval_roc_auc": 0.8203220599321907,
+      "eval_runtime": 379.1064,
+      "eval_samples_per_second": 7.581,
+      "eval_steps_per_second": 0.237,
+      "learning_rate": 0.001,
+      "step": 4932
+    },
+    {
+      "epoch": 18.25,
+      "learning_rate": 0.001,
+      "loss": 0.1764,
+      "step": 5000
+    },
+    {
+      "epoch": 19.0,
+      "eval_accuracy": 0.3990953375086987,
+      "eval_f1_macro": 0.6286877926596727,
+      "eval_f1_micro": 0.7480261112838048,
+      "eval_loss": 0.15578077733516693,
+      "eval_roc_auc": 0.8236456074129308,
+      "eval_runtime": 380.5374,
+      "eval_samples_per_second": 7.552,
+      "eval_steps_per_second": 0.237,
+      "learning_rate": 0.001,
+      "step": 5206
+    },
+    {
+      "epoch": 20.0,
+      "eval_accuracy": 0.4001391788448156,
+      "eval_f1_macro": 0.608545078452072,
+      "eval_f1_micro": 0.7402785655763534,
+      "eval_loss": 0.15735512971878052,
+      "eval_roc_auc": 0.8163778880079953,
+      "eval_runtime": 371.4966,
+      "eval_samples_per_second": 7.736,
+      "eval_steps_per_second": 0.242,
+      "learning_rate": 0.001,
+      "step": 5480
+    },
+    {
+      "epoch": 20.07,
+      "learning_rate": 0.001,
+      "loss": 0.1775,
+      "step": 5500
+    },
+    {
+      "epoch": 21.0,
+      "eval_accuracy": 0.40292275574112735,
+      "eval_f1_macro": 0.6245521933830414,
+      "eval_f1_micro": 0.753183153770813,
+      "eval_loss": 0.15607939660549164,
+      "eval_roc_auc": 0.8301931385420087,
+      "eval_runtime": 382.1339,
+      "eval_samples_per_second": 7.521,
+      "eval_steps_per_second": 0.236,
+      "learning_rate": 0.001,
+      "step": 5754
+    },
+    {
+      "epoch": 21.9,
+      "learning_rate": 0.0001,
+      "loss": 0.177,
+      "step": 6000
+    },
+    {
+      "epoch": 22.0,
+      "eval_accuracy": 0.39735560194850383,
+      "eval_f1_macro": 0.6430549553924351,
+      "eval_f1_micro": 0.7596049620619053,
+      "eval_loss": 0.1545252650976181,
+      "eval_roc_auc": 0.8377894663149374,
+      "eval_runtime": 374.7337,
+      "eval_samples_per_second": 7.669,
+      "eval_steps_per_second": 0.24,
+      "learning_rate": 0.0001,
+      "step": 6028
+    },
+    {
+      "epoch": 23.0,
+      "eval_accuracy": 0.4025748086290884,
+      "eval_f1_macro": 0.6291738798521619,
+      "eval_f1_micro": 0.7472035794183445,
+      "eval_loss": 0.1555616706609726,
+      "eval_roc_auc": 0.8233330160035968,
+      "eval_runtime": 372.3825,
+      "eval_samples_per_second": 7.718,
+      "eval_steps_per_second": 0.242,
+      "learning_rate": 0.0001,
+      "step": 6302
+    },
+    {
+      "epoch": 23.72,
+      "learning_rate": 0.0001,
+      "loss": 0.1762,
+      "step": 6500
+    },
+    {
+      "epoch": 24.0,
+      "eval_accuracy": 0.39944328462073764,
+      "eval_f1_macro": 0.6343316351234961,
+      "eval_f1_micro": 0.752788906009245,
+      "eval_loss": 0.1547899842262268,
+      "eval_roc_auc": 0.8282598991861336,
+      "eval_runtime": 369.1278,
+      "eval_samples_per_second": 7.786,
+      "eval_steps_per_second": 0.244,
+      "learning_rate": 0.0001,
+      "step": 6576
+    },
+    {
+      "epoch": 25.0,
+      "eval_accuracy": 0.39944328462073764,
+      "eval_f1_macro": 0.6224788217146914,
+      "eval_f1_micro": 0.7467564870259481,
+      "eval_loss": 0.15538595616817474,
+      "eval_roc_auc": 0.8221815416817054,
+      "eval_runtime": 366.9271,
+      "eval_samples_per_second": 7.833,
+      "eval_steps_per_second": 0.245,
+      "learning_rate": 0.0001,
+      "step": 6850
+    },
+    {
+      "epoch": 25.55,
+      "learning_rate": 0.0001,
+      "loss": 0.1759,
+      "step": 7000
+    },
+    {
+      "epoch": 26.0,
+      "eval_accuracy": 0.3977035490605428,
+      "eval_f1_macro": 0.632595682527143,
+      "eval_f1_micro": 0.7529426189308485,
+      "eval_loss": 0.1547958254814148,
+      "eval_roc_auc": 0.8296944220765509,
+      "eval_runtime": 367.9424,
+      "eval_samples_per_second": 7.811,
+      "eval_steps_per_second": 0.245,
+      "learning_rate": 0.0001,
+      "step": 7124
+    },
+    {
+      "epoch": 27.0,
+      "eval_accuracy": 0.3970076548364649,
+      "eval_f1_macro": 0.6352159754424679,
+      "eval_f1_micro": 0.7516299667855824,
+      "eval_loss": 0.1552300751209259,
+      "eval_roc_auc": 0.8281751565219652,
+      "eval_runtime": 367.5636,
+      "eval_samples_per_second": 7.819,
+      "eval_steps_per_second": 0.245,
+      "learning_rate": 0.0001,
+      "step": 7398
+    },
+    {
+      "epoch": 27.37,
+      "learning_rate": 0.0001,
+      "loss": 0.1752,
+      "step": 7500
+    },
+    {
+      "epoch": 28.0,
+      "eval_accuracy": 0.4091858037578288,
+      "eval_f1_macro": 0.6327633387519097,
+      "eval_f1_micro": 0.7523139577934099,
+      "eval_loss": 0.1543245166540146,
+      "eval_roc_auc": 0.8277194590316342,
+      "eval_runtime": 363.6815,
+      "eval_samples_per_second": 7.903,
+      "eval_steps_per_second": 0.247,
+      "learning_rate": 0.0001,
+      "step": 7672
+    },
+    {
+      "epoch": 29.0,
+      "eval_accuracy": 0.40187891440501045,
+      "eval_f1_macro": 0.6311913970379929,
+      "eval_f1_micro": 0.7505715168365771,
+      "eval_loss": 0.15445660054683685,
+      "eval_roc_auc": 0.8264967181798933,
+      "eval_runtime": 370.9747,
+      "eval_samples_per_second": 7.747,
+      "eval_steps_per_second": 0.243,
+      "learning_rate": 0.0001,
+      "step": 7946
+    },
+    {
+      "epoch": 29.2,
+      "learning_rate": 0.0001,
+      "loss": 0.1757,
+      "step": 8000
+    },
+    {
+      "epoch": 30.0,
+      "eval_accuracy": 0.40396659707724425,
+      "eval_f1_macro": 0.6394187347167111,
+      "eval_f1_micro": 0.7554370872962985,
+      "eval_loss": 0.15497015416622162,
+      "eval_roc_auc": 0.834040386953802,
+      "eval_runtime": 370.7394,
+      "eval_samples_per_second": 7.752,
+      "eval_steps_per_second": 0.243,
+      "learning_rate": 0.0001,
+      "step": 8220
+    },
+    {
+      "epoch": 31.0,
+      "eval_accuracy": 0.4022268615170494,
+      "eval_f1_macro": 0.6345022832926616,
+      "eval_f1_micro": 0.7511534912334668,
+      "eval_loss": 0.15540161728858948,
+      "eval_roc_auc": 0.8278824679295457,
+      "eval_runtime": 373.8253,
+      "eval_samples_per_second": 7.688,
+      "eval_steps_per_second": 0.241,
+      "learning_rate": 0.0001,
+      "step": 8494
+    },
+    {
+      "epoch": 31.02,
+      "learning_rate": 0.0001,
+      "loss": 0.1758,
+      "step": 8500
+    },
+    {
+      "epoch": 32.0,
+      "eval_accuracy": 0.4032707028531663,
+      "eval_f1_macro": 0.6301888508291651,
+      "eval_f1_micro": 0.7513253606213783,
+      "eval_loss": 0.15450650453567505,
+      "eval_roc_auc": 0.8274588541043629,
+      "eval_runtime": 366.8538,
+      "eval_samples_per_second": 7.834,
+      "eval_steps_per_second": 0.245,
+      "learning_rate": 0.0001,
+      "step": 8768
+    },
+    {
+      "epoch": 32.85,
+      "learning_rate": 0.0001,
+      "loss": 0.1755,
+      "step": 9000
+    },
+    {
+      "epoch": 33.0,
+      "eval_accuracy": 0.3977035490605428,
+      "eval_f1_macro": 0.6261364069131695,
+      "eval_f1_micro": 0.7456298600311042,
+      "eval_loss": 0.15546494722366333,
+      "eval_roc_auc": 0.8222675298841294,
+      "eval_runtime": 372.6997,
+      "eval_samples_per_second": 7.711,
+      "eval_steps_per_second": 0.241,
+      "learning_rate": 0.0001,
+      "step": 9042
+    },
+    {
+      "epoch": 34.0,
+      "eval_accuracy": 0.41092553931802367,
+      "eval_f1_macro": 0.6307477868895636,
+      "eval_f1_micro": 0.7514572739675058,
+      "eval_loss": 0.15329033136367798,
+      "eval_roc_auc": 0.8260358892930517,
+      "eval_runtime": 370.3661,
+      "eval_samples_per_second": 7.76,
+      "eval_steps_per_second": 0.243,
+      "learning_rate": 0.0001,
+      "step": 9316
+    },
+    {
+      "epoch": 34.67,
+      "learning_rate": 0.0001,
+      "loss": 0.1752,
+      "step": 9500
+    },
+    {
+      "epoch": 35.0,
+      "eval_accuracy": 0.40535838552540016,
+      "eval_f1_macro": 0.6325032556817062,
+      "eval_f1_micro": 0.7506499938095826,
+      "eval_loss": 0.15512260794639587,
+      "eval_roc_auc": 0.8260564148790938,
+      "eval_runtime": 369.1819,
+      "eval_samples_per_second": 7.785,
+      "eval_steps_per_second": 0.244,
+      "learning_rate": 0.0001,
+      "step": 9590
+    },
+    {
+      "epoch": 36.0,
+      "eval_accuracy": 0.4025748086290884,
+      "eval_f1_macro": 0.6299014754104307,
+      "eval_f1_micro": 0.7539002281556392,
+      "eval_loss": 0.15303632616996765,
+      "eval_roc_auc": 0.8287079244556137,
+      "eval_runtime": 369.3754,
+      "eval_samples_per_second": 7.781,
+      "eval_steps_per_second": 0.244,
+      "learning_rate": 0.0001,
+      "step": 9864
+    },
+    {
+      "epoch": 36.5,
+      "learning_rate": 0.0001,
+      "loss": 0.1752,
+      "step": 10000
+    },
+    {
+      "epoch": 37.0,
+      "eval_accuracy": 0.4036186499652053,
+      "eval_f1_macro": 0.6270201439545436,
+      "eval_f1_micro": 0.7464025415810128,
+      "eval_loss": 0.1545841097831726,
+      "eval_roc_auc": 0.8223240249935749,
+      "eval_runtime": 381.9233,
+      "eval_samples_per_second": 7.525,
+      "eval_steps_per_second": 0.236,
+      "learning_rate": 0.0001,
+      "step": 10138
+    },
+    {
+      "epoch": 38.0,
+      "eval_accuracy": 0.3987473903966597,
+      "eval_f1_macro": 0.6363851637994423,
+      "eval_f1_micro": 0.7538583541755627,
+      "eval_loss": 0.1548989862203598,
+      "eval_roc_auc": 0.8314331916384938,
+      "eval_runtime": 372.9722,
+      "eval_samples_per_second": 7.706,
+      "eval_steps_per_second": 0.241,
+      "learning_rate": 0.0001,
+      "step": 10412
+    },
+    {
+      "epoch": 38.32,
+      "learning_rate": 0.0001,
+      "loss": 0.1763,
+      "step": 10500
+    },
+    {
+      "epoch": 39.0,
+      "eval_accuracy": 0.3977035490605428,
+      "eval_f1_macro": 0.6420887435658987,
+      "eval_f1_micro": 0.7579290763003684,
+      "eval_loss": 0.15474249422550201,
+      "eval_roc_auc": 0.8360712223390366,
+      "eval_runtime": 367.6796,
+      "eval_samples_per_second": 7.817,
+      "eval_steps_per_second": 0.245,
+      "learning_rate": 0.0001,
+      "step": 10686
+    },
+    {
+      "epoch": 40.0,
+      "eval_accuracy": 0.40048712595685454,
+      "eval_f1_macro": 0.6344591092641424,
+      "eval_f1_micro": 0.7539234919077978,
+      "eval_loss": 0.15435411036014557,
+      "eval_roc_auc": 0.8302027785659021,
+      "eval_runtime": 366.3255,
+      "eval_samples_per_second": 7.845,
+      "eval_steps_per_second": 0.246,
+      "learning_rate": 0.0001,
+      "step": 10960
+    },
+    {
+      "epoch": 40.15,
+      "learning_rate": 0.0001,
+      "loss": 0.176,
+      "step": 11000
+    },
+    {
+      "epoch": 41.0,
+      "eval_accuracy": 0.40153096729297144,
+      "eval_f1_macro": 0.6347263815695223,
+      "eval_f1_micro": 0.7535591556210112,
+      "eval_loss": 0.15571445226669312,
+      "eval_roc_auc": 0.8297643933203154,
+      "eval_runtime": 368.1721,
+      "eval_samples_per_second": 7.806,
+      "eval_steps_per_second": 0.244,
+      "learning_rate": 0.0001,
+      "step": 11234
+    },
+    {
+      "epoch": 41.97,
+      "learning_rate": 0.0001,
+      "loss": 0.1758,
+      "step": 11500
+    },
+    {
+      "epoch": 42.0,
+      "eval_accuracy": 0.3959638135003479,
+      "eval_f1_macro": 0.627716108835686,
+      "eval_f1_micro": 0.7474281438992456,
+      "eval_loss": 0.15399669110774994,
+      "eval_roc_auc": 0.8226314850063985,
+      "eval_runtime": 371.1239,
+      "eval_samples_per_second": 7.744,
+      "eval_steps_per_second": 0.243,
+      "learning_rate": 0.0001,
+      "step": 11508
+    },
+    {
+      "epoch": 43.0,
+      "eval_accuracy": 0.3970076548364649,
+      "eval_f1_macro": 0.6383655319176039,
+      "eval_f1_micro": 0.7577960704199963,
+      "eval_loss": 0.1547509878873825,
+      "eval_roc_auc": 0.83741716645486,
+      "eval_runtime": 365.888,
+      "eval_samples_per_second": 7.855,
+      "eval_steps_per_second": 0.246,
+      "learning_rate": 1e-05,
+      "step": 11782
+    },
+    {
+      "epoch": 43.8,
+      "learning_rate": 1e-05,
+      "loss": 0.1764,
+      "step": 12000
+    },
+    {
+      "epoch": 44.0,
+      "eval_accuracy": 0.4011830201809325,
+      "eval_f1_macro": 0.6398260147869291,
+      "eval_f1_micro": 0.758185787048266,
+      "eval_loss": 0.15433941781520844,
+      "eval_roc_auc": 0.8352458155607984,
+      "eval_runtime": 377.6162,
+      "eval_samples_per_second": 7.611,
+      "eval_steps_per_second": 0.238,
+      "learning_rate": 1e-05,
+      "step": 12056
+    },
+    {
+      "epoch": 45.0,
+      "eval_accuracy": 0.3990953375086987,
+      "eval_f1_macro": 0.6206082021561579,
+      "eval_f1_micro": 0.7447583176396736,
+      "eval_loss": 0.1543821096420288,
+      "eval_roc_auc": 0.8196012986350353,
+      "eval_runtime": 369.6762,
+      "eval_samples_per_second": 7.774,
+      "eval_steps_per_second": 0.243,
+      "learning_rate": 1e-05,
+      "step": 12330
+    },
+    {
+      "epoch": 45.62,
+      "learning_rate": 1e-05,
+      "loss": 0.1746,
+      "step": 12500
+    },
+    {
+      "epoch": 46.0,
+      "eval_accuracy": 0.40501043841336115,
+      "eval_f1_macro": 0.6223405225541471,
+      "eval_f1_micro": 0.7452157598499062,
+      "eval_loss": 0.15461167693138123,
+      "eval_roc_auc": 0.8207527729569265,
+      "eval_runtime": 369.5577,
+      "eval_samples_per_second": 7.777,
+      "eval_steps_per_second": 0.244,
+      "learning_rate": 1e-05,
+      "step": 12604
+    },
+    {
+      "epoch": 46.0,
+      "learning_rate": 1e-05,
+      "step": 12604,
+      "total_flos": 4.586865882212175e+19,
+      "train_loss": 0.1827572128274107,
+      "train_runtime": 70769.3212,
+      "train_samples_per_second": 11.517,
+      "train_steps_per_second": 0.36
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 25482,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 93,
+  "save_steps": 500,
+  "total_flos": 4.586865882212175e+19,
+  "train_batch_size": 32,
+  "trial_name": null,
+  "trial_params": null
+}