RudranshAgnihotri commited on Nov 11, 2023

Commit

fb16342

1 Parent(s): 39c0815

Upload 27 files

Browse files

Files changed (27) hide show

adapter_config.json +21 -0
adapter_model.bin +3 -0
checkpoint-200/README.md +21 -0
checkpoint-200/adapter_config.json +21 -0
checkpoint-200/adapter_model.bin +3 -0
checkpoint-200/optimizer.pt +3 -0
checkpoint-200/rng_state.pth +3 -0
checkpoint-200/scheduler.pt +3 -0
checkpoint-200/trainer_state.json +171 -0
checkpoint-200/training_args.bin +3 -0
checkpoint-250/README.md +21 -0
checkpoint-250/adapter_config.json +21 -0
checkpoint-250/adapter_model.bin +3 -0
checkpoint-250/optimizer.pt +3 -0
checkpoint-250/rng_state.pth +3 -0
checkpoint-250/scheduler.pt +3 -0
checkpoint-250/trainer_state.json +209 -0
checkpoint-250/training_args.bin +3 -0
checkpoint-300/README.md +21 -0
checkpoint-300/adapter_config.json +21 -0
checkpoint-300/adapter_model.bin +3 -0
checkpoint-300/optimizer.pt +3 -0
checkpoint-300/rng_state.pth +3 -0
checkpoint-300/scheduler.pt +3 -0
checkpoint-300/trainer_state.json +247 -0
checkpoint-300/training_args.bin +3 -0
runs/Oct30_16-50-39_dlvm-backup/events.out.tfevents.1698664868.dlvm-backup.46784.0 +3 -0

adapter_config.json ADDED Viewed

	@@ -0,0 +1,21 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "lmsys/vicuna-7b-v1.5",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 16,
+  "lora_dropout": 0.05,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 8,
+  "revision": null,
+  "target_modules": [
+    "q_proj",
+    "v_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e5e1621f48d9ad8feb1d6d31050275f0aafd080c5c07153301fe2f48411f4406
+size 443

checkpoint-200/README.md ADDED Viewed

	@@ -0,0 +1,21 @@

+---
+library_name: peft
+---
+## Training procedure
+The following `bitsandbytes` quantization config was used during training:
+- quant_method: bitsandbytes
+- load_in_8bit: True
+- load_in_4bit: False
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: fp4
+- bnb_4bit_use_double_quant: False
+- bnb_4bit_compute_dtype: float32
+### Framework versions
+- PEFT 0.5.0

checkpoint-200/adapter_config.json ADDED Viewed

	@@ -0,0 +1,21 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "lmsys/vicuna-7b-v1.5",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 16,
+  "lora_dropout": 0.05,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 8,
+  "revision": null,
+  "target_modules": [
+    "q_proj",
+    "v_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

checkpoint-200/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e5e1621f48d9ad8feb1d6d31050275f0aafd080c5c07153301fe2f48411f4406
+size 443

checkpoint-200/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5586cf3c40d1c5285c07dbfeafa143aeb9b9dc9763b3d64785b931bb6dc6860b
+size 33661637

checkpoint-200/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2fbdfe696de057d5f11e62de2da1f77c6dbbf699e999d2726555719b7524f23c
+size 14575

checkpoint-200/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ff1d2d66aaa92aa201414fe4901c3648a1b203ae833acca5bb9f505ee9af884c
+size 627

checkpoint-200/trainer_state.json ADDED Viewed

	@@ -0,0 +1,171 @@

+{
+  "best_metric": 1.2936323881149292,
+  "best_model_checkpoint": "  vicuna-sentiment-fintuned/checkpoint-200",
+  "epoch": 1.032258064516129,
+  "eval_steps": 50,
+  "global_step": 200,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.05,
+      "learning_rate": 2.9999999999999997e-05,
+      "loss": 2.9781,
+      "step": 10
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 5.9999999999999995e-05,
+      "loss": 2.8488,
+      "step": 20
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 8.999999999999999e-05,
+      "loss": 2.5361,
+      "step": 30
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 0.00011999999999999999,
+      "loss": 2.0695,
+      "step": 40
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 0.00015,
+      "loss": 1.6545,
+      "step": 50
+    },
+    {
+      "epoch": 0.26,
+      "eval_loss": 1.5430564880371094,
+      "eval_runtime": 40.717,
+      "eval_samples_per_second": 4.912,
+      "eval_steps_per_second": 0.614,
+      "step": 50
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 0.00017999999999999998,
+      "loss": 1.4716,
+      "step": 60
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 0.00020999999999999998,
+      "loss": 1.4078,
+      "step": 70
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 0.00023999999999999998,
+      "loss": 1.3884,
+      "step": 80
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 0.00027,
+      "loss": 1.4108,
+      "step": 90
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 0.0003,
+      "loss": 1.3022,
+      "step": 100
+    },
+    {
+      "epoch": 0.52,
+      "eval_loss": 1.3164671659469604,
+      "eval_runtime": 40.8127,
+      "eval_samples_per_second": 4.9,
+      "eval_steps_per_second": 0.613,
+      "step": 100
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 0.000285,
+      "loss": 1.2699,
+      "step": 110
+    },
+    {
+      "epoch": 0.62,
+      "learning_rate": 0.00027,
+      "loss": 1.2852,
+      "step": 120
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 0.00025499999999999996,
+      "loss": 1.278,
+      "step": 130
+    },
+    {
+      "epoch": 0.72,
+      "learning_rate": 0.00023999999999999998,
+      "loss": 1.2947,
+      "step": 140
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 0.000225,
+      "loss": 1.2836,
+      "step": 150
+    },
+    {
+      "epoch": 0.77,
+      "eval_loss": 1.2997195720672607,
+      "eval_runtime": 40.7239,
+      "eval_samples_per_second": 4.911,
+      "eval_steps_per_second": 0.614,
+      "step": 150
+    },
+    {
+      "epoch": 0.83,
+      "learning_rate": 0.00020999999999999998,
+      "loss": 1.2874,
+      "step": 160
+    },
+    {
+      "epoch": 0.88,
+      "learning_rate": 0.000195,
+      "loss": 1.3118,
+      "step": 170
+    },
+    {
+      "epoch": 0.93,
+      "learning_rate": 0.00017999999999999998,
+      "loss": 1.2895,
+      "step": 180
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 0.000165,
+      "loss": 1.2736,
+      "step": 190
+    },
+    {
+      "epoch": 1.03,
+      "learning_rate": 0.00015,
+      "loss": 1.2634,
+      "step": 200
+    },
+    {
+      "epoch": 1.03,
+      "eval_loss": 1.2936323881149292,
+      "eval_runtime": 40.7736,
+      "eval_samples_per_second": 4.905,
+      "eval_steps_per_second": 0.613,
+      "step": 200
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 300,
+  "num_train_epochs": 2,
+  "save_steps": 50,
+  "total_flos": 2.1403198486904832e+17,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-200/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:89ed21dfdc4062abd1a8a7c960722d6fddba4b5aa46972581d57b2fd0aae7f23
+size 4091

checkpoint-250/README.md ADDED Viewed

	@@ -0,0 +1,21 @@

+---
+library_name: peft
+---
+## Training procedure
+The following `bitsandbytes` quantization config was used during training:
+- quant_method: bitsandbytes
+- load_in_8bit: True
+- load_in_4bit: False
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: fp4
+- bnb_4bit_use_double_quant: False
+- bnb_4bit_compute_dtype: float32
+### Framework versions
+- PEFT 0.5.0

checkpoint-250/adapter_config.json ADDED Viewed

	@@ -0,0 +1,21 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "lmsys/vicuna-7b-v1.5",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 16,
+  "lora_dropout": 0.05,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 8,
+  "revision": null,
+  "target_modules": [
+    "q_proj",
+    "v_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

checkpoint-250/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e5e1621f48d9ad8feb1d6d31050275f0aafd080c5c07153301fe2f48411f4406
+size 443

checkpoint-250/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:81636914f9e3ece6293d2626edae80b245de5e3095513f3c3dab625cdb540f8e
+size 33661637

checkpoint-250/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:129e3555b63fc130098c791d380941bd58bfca28dfa7d80283359b2699b4e411
+size 14575

checkpoint-250/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c3c5e60ae2c5fa47c1e0094605fa82d39944033b90dea5e928f80a3f8d09feaf
+size 627

checkpoint-250/trainer_state.json ADDED Viewed

	@@ -0,0 +1,209 @@

+{
+  "best_metric": 1.2897050380706787,
+  "best_model_checkpoint": "  vicuna-sentiment-fintuned/checkpoint-250",
+  "epoch": 1.2903225806451613,
+  "eval_steps": 50,
+  "global_step": 250,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.05,
+      "learning_rate": 2.9999999999999997e-05,
+      "loss": 2.9781,
+      "step": 10
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 5.9999999999999995e-05,
+      "loss": 2.8488,
+      "step": 20
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 8.999999999999999e-05,
+      "loss": 2.5361,
+      "step": 30
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 0.00011999999999999999,
+      "loss": 2.0695,
+      "step": 40
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 0.00015,
+      "loss": 1.6545,
+      "step": 50
+    },
+    {
+      "epoch": 0.26,
+      "eval_loss": 1.5430564880371094,
+      "eval_runtime": 40.717,
+      "eval_samples_per_second": 4.912,
+      "eval_steps_per_second": 0.614,
+      "step": 50
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 0.00017999999999999998,
+      "loss": 1.4716,
+      "step": 60
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 0.00020999999999999998,
+      "loss": 1.4078,
+      "step": 70
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 0.00023999999999999998,
+      "loss": 1.3884,
+      "step": 80
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 0.00027,
+      "loss": 1.4108,
+      "step": 90
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 0.0003,
+      "loss": 1.3022,
+      "step": 100
+    },
+    {
+      "epoch": 0.52,
+      "eval_loss": 1.3164671659469604,
+      "eval_runtime": 40.8127,
+      "eval_samples_per_second": 4.9,
+      "eval_steps_per_second": 0.613,
+      "step": 100
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 0.000285,
+      "loss": 1.2699,
+      "step": 110
+    },
+    {
+      "epoch": 0.62,
+      "learning_rate": 0.00027,
+      "loss": 1.2852,
+      "step": 120
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 0.00025499999999999996,
+      "loss": 1.278,
+      "step": 130
+    },
+    {
+      "epoch": 0.72,
+      "learning_rate": 0.00023999999999999998,
+      "loss": 1.2947,
+      "step": 140
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 0.000225,
+      "loss": 1.2836,
+      "step": 150
+    },
+    {
+      "epoch": 0.77,
+      "eval_loss": 1.2997195720672607,
+      "eval_runtime": 40.7239,
+      "eval_samples_per_second": 4.911,
+      "eval_steps_per_second": 0.614,
+      "step": 150
+    },
+    {
+      "epoch": 0.83,
+      "learning_rate": 0.00020999999999999998,
+      "loss": 1.2874,
+      "step": 160
+    },
+    {
+      "epoch": 0.88,
+      "learning_rate": 0.000195,
+      "loss": 1.3118,
+      "step": 170
+    },
+    {
+      "epoch": 0.93,
+      "learning_rate": 0.00017999999999999998,
+      "loss": 1.2895,
+      "step": 180
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 0.000165,
+      "loss": 1.2736,
+      "step": 190
+    },
+    {
+      "epoch": 1.03,
+      "learning_rate": 0.00015,
+      "loss": 1.2634,
+      "step": 200
+    },
+    {
+      "epoch": 1.03,
+      "eval_loss": 1.2936323881149292,
+      "eval_runtime": 40.7736,
+      "eval_samples_per_second": 4.905,
+      "eval_steps_per_second": 0.613,
+      "step": 200
+    },
+    {
+      "epoch": 1.08,
+      "learning_rate": 0.000135,
+      "loss": 1.2726,
+      "step": 210
+    },
+    {
+      "epoch": 1.14,
+      "learning_rate": 0.00011999999999999999,
+      "loss": 1.2617,
+      "step": 220
+    },
+    {
+      "epoch": 1.19,
+      "learning_rate": 0.00010499999999999999,
+      "loss": 1.2632,
+      "step": 230
+    },
+    {
+      "epoch": 1.24,
+      "learning_rate": 8.999999999999999e-05,
+      "loss": 1.2847,
+      "step": 240
+    },
+    {
+      "epoch": 1.29,
+      "learning_rate": 7.5e-05,
+      "loss": 1.2622,
+      "step": 250
+    },
+    {
+      "epoch": 1.29,
+      "eval_loss": 1.2897050380706787,
+      "eval_runtime": 40.6649,
+      "eval_samples_per_second": 4.918,
+      "eval_steps_per_second": 0.615,
+      "step": 250
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 300,
+  "num_train_epochs": 2,
+  "save_steps": 50,
+  "total_flos": 2.6747817642983424e+17,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-250/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:89ed21dfdc4062abd1a8a7c960722d6fddba4b5aa46972581d57b2fd0aae7f23
+size 4091

checkpoint-300/README.md ADDED Viewed

	@@ -0,0 +1,21 @@

+---
+library_name: peft
+---
+## Training procedure
+The following `bitsandbytes` quantization config was used during training:
+- quant_method: bitsandbytes
+- load_in_8bit: True
+- load_in_4bit: False
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: fp4
+- bnb_4bit_use_double_quant: False
+- bnb_4bit_compute_dtype: float32
+### Framework versions
+- PEFT 0.5.0

checkpoint-300/adapter_config.json ADDED Viewed

	@@ -0,0 +1,21 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "lmsys/vicuna-7b-v1.5",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 16,
+  "lora_dropout": 0.05,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 8,
+  "revision": null,
+  "target_modules": [
+    "q_proj",
+    "v_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

checkpoint-300/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e5e1621f48d9ad8feb1d6d31050275f0aafd080c5c07153301fe2f48411f4406
+size 443

checkpoint-300/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0c2e22affd7b6a4bf1a293d2806a4ad0c36d87ab13d707475edb448b8ceb8312
+size 33661637

checkpoint-300/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:31bcc8661e913f6facfebf28c63663cffadb54a6426f48765602c7005eed2fad
+size 14575

checkpoint-300/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:503d141bd03d55a69c94b428e328d3b060b988ace448865bb4b7d17216ac0c68
+size 627

checkpoint-300/trainer_state.json ADDED Viewed

	@@ -0,0 +1,247 @@

+{
+  "best_metric": 1.2886592149734497,
+  "best_model_checkpoint": "  vicuna-sentiment-fintuned/checkpoint-300",
+  "epoch": 1.5483870967741935,
+  "eval_steps": 50,
+  "global_step": 300,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.05,
+      "learning_rate": 2.9999999999999997e-05,
+      "loss": 2.9781,
+      "step": 10
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 5.9999999999999995e-05,
+      "loss": 2.8488,
+      "step": 20
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 8.999999999999999e-05,
+      "loss": 2.5361,
+      "step": 30
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 0.00011999999999999999,
+      "loss": 2.0695,
+      "step": 40
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 0.00015,
+      "loss": 1.6545,
+      "step": 50
+    },
+    {
+      "epoch": 0.26,
+      "eval_loss": 1.5430564880371094,
+      "eval_runtime": 40.717,
+      "eval_samples_per_second": 4.912,
+      "eval_steps_per_second": 0.614,
+      "step": 50
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 0.00017999999999999998,
+      "loss": 1.4716,
+      "step": 60
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 0.00020999999999999998,
+      "loss": 1.4078,
+      "step": 70
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 0.00023999999999999998,
+      "loss": 1.3884,
+      "step": 80
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 0.00027,
+      "loss": 1.4108,
+      "step": 90
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 0.0003,
+      "loss": 1.3022,
+      "step": 100
+    },
+    {
+      "epoch": 0.52,
+      "eval_loss": 1.3164671659469604,
+      "eval_runtime": 40.8127,
+      "eval_samples_per_second": 4.9,
+      "eval_steps_per_second": 0.613,
+      "step": 100
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 0.000285,
+      "loss": 1.2699,
+      "step": 110
+    },
+    {
+      "epoch": 0.62,
+      "learning_rate": 0.00027,
+      "loss": 1.2852,
+      "step": 120
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 0.00025499999999999996,
+      "loss": 1.278,
+      "step": 130
+    },
+    {
+      "epoch": 0.72,
+      "learning_rate": 0.00023999999999999998,
+      "loss": 1.2947,
+      "step": 140
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 0.000225,
+      "loss": 1.2836,
+      "step": 150
+    },
+    {
+      "epoch": 0.77,
+      "eval_loss": 1.2997195720672607,
+      "eval_runtime": 40.7239,
+      "eval_samples_per_second": 4.911,
+      "eval_steps_per_second": 0.614,
+      "step": 150
+    },
+    {
+      "epoch": 0.83,
+      "learning_rate": 0.00020999999999999998,
+      "loss": 1.2874,
+      "step": 160
+    },
+    {
+      "epoch": 0.88,
+      "learning_rate": 0.000195,
+      "loss": 1.3118,
+      "step": 170
+    },
+    {
+      "epoch": 0.93,
+      "learning_rate": 0.00017999999999999998,
+      "loss": 1.2895,
+      "step": 180
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 0.000165,
+      "loss": 1.2736,
+      "step": 190
+    },
+    {
+      "epoch": 1.03,
+      "learning_rate": 0.00015,
+      "loss": 1.2634,
+      "step": 200
+    },
+    {
+      "epoch": 1.03,
+      "eval_loss": 1.2936323881149292,
+      "eval_runtime": 40.7736,
+      "eval_samples_per_second": 4.905,
+      "eval_steps_per_second": 0.613,
+      "step": 200
+    },
+    {
+      "epoch": 1.08,
+      "learning_rate": 0.000135,
+      "loss": 1.2726,
+      "step": 210
+    },
+    {
+      "epoch": 1.14,
+      "learning_rate": 0.00011999999999999999,
+      "loss": 1.2617,
+      "step": 220
+    },
+    {
+      "epoch": 1.19,
+      "learning_rate": 0.00010499999999999999,
+      "loss": 1.2632,
+      "step": 230
+    },
+    {
+      "epoch": 1.24,
+      "learning_rate": 8.999999999999999e-05,
+      "loss": 1.2847,
+      "step": 240
+    },
+    {
+      "epoch": 1.29,
+      "learning_rate": 7.5e-05,
+      "loss": 1.2622,
+      "step": 250
+    },
+    {
+      "epoch": 1.29,
+      "eval_loss": 1.2897050380706787,
+      "eval_runtime": 40.6649,
+      "eval_samples_per_second": 4.918,
+      "eval_steps_per_second": 0.615,
+      "step": 250
+    },
+    {
+      "epoch": 1.34,
+      "learning_rate": 5.9999999999999995e-05,
+      "loss": 1.2719,
+      "step": 260
+    },
+    {
+      "epoch": 1.39,
+      "learning_rate": 4.4999999999999996e-05,
+      "loss": 1.2564,
+      "step": 270
+    },
+    {
+      "epoch": 1.45,
+      "learning_rate": 2.9999999999999997e-05,
+      "loss": 1.28,
+      "step": 280
+    },
+    {
+      "epoch": 1.5,
+      "learning_rate": 1.4999999999999999e-05,
+      "loss": 1.2821,
+      "step": 290
+    },
+    {
+      "epoch": 1.55,
+      "learning_rate": 0.0,
+      "loss": 1.2826,
+      "step": 300
+    },
+    {
+      "epoch": 1.55,
+      "eval_loss": 1.2886592149734497,
+      "eval_runtime": 40.0411,
+      "eval_samples_per_second": 4.995,
+      "eval_steps_per_second": 0.624,
+      "step": 300
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 300,
+  "num_train_epochs": 2,
+  "save_steps": 50,
+  "total_flos": 3.214562529932083e+17,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-300/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:89ed21dfdc4062abd1a8a7c960722d6fddba4b5aa46972581d57b2fd0aae7f23
+size 4091

runs/Oct30_16-50-39_dlvm-backup/events.out.tfevents.1698664868.dlvm-backup.46784.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a71201efa9949b22d083807baedc577d8016d748bacdc8572eff2cd414c822c3
+size 11227