Training in progress, step 6750, checkpoint

Browse files

Files changed (7) hide show

checkpoint-6750/config.json +92 -0
checkpoint-6750/model.safetensors +3 -0
checkpoint-6750/optimizer.pt +3 -0
checkpoint-6750/rng_state.pth +3 -0
checkpoint-6750/scheduler.pt +3 -0
checkpoint-6750/trainer_state.json +150 -0
checkpoint-6750/training_args.bin +3 -0

checkpoint-6750/config.json ADDED Viewed

	@@ -0,0 +1,92 @@

+{
+  "_name_or_path": "nvidia/mit-b5",
+  "architectures": [
+    "SegformerForSemanticSegmentation"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "classifier_dropout_prob": 0.1,
+  "decoder_hidden_size": 768,
+  "depths": [
+    3,
+    6,
+    40,
+    3
+  ],
+  "downsampling_rates": [
+    1,
+    4,
+    8,
+    16
+  ],
+  "drop_path_rate": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_sizes": [
+    64,
+    128,
+    320,
+    512
+  ],
+  "id2label": {
+    "0": "background",
+    "1": "double_plant",
+    "2": "drydown",
+    "3": "endrow",
+    "4": "nutrient_deficiency",
+    "5": "planter_skip",
+    "6": "water",
+    "7": "waterway",
+    "8": "weed_cluster"
+  },
+  "image_size": 224,
+  "initializer_range": 0.02,
+  "label2id": {
+    "background": 0,
+    "double_plant": 1,
+    "drydown": 2,
+    "endrow": 3,
+    "nutrient_deficiency": 4,
+    "planter_skip": 5,
+    "water": 6,
+    "waterway": 7,
+    "weed_cluster": 8
+  },
+  "layer_norm_eps": 1e-06,
+  "mlp_ratios": [
+    4,
+    4,
+    4,
+    4
+  ],
+  "model_type": "segformer",
+  "num_attention_heads": [
+    1,
+    2,
+    5,
+    8
+  ],
+  "num_channels": 4,
+  "num_encoder_blocks": 4,
+  "patch_sizes": [
+    7,
+    3,
+    3,
+    3
+  ],
+  "reshape_last_stage": true,
+  "semantic_loss_ignore_index": 255,
+  "sr_ratios": [
+    8,
+    4,
+    2,
+    1
+  ],
+  "strides": [
+    4,
+    2,
+    2,
+    2
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.40.2"
+}

checkpoint-6750/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bdd7894ebc1264a8bcfd597f3b17faf4f7cefa8b58f245ef973c245f0ac50996
+size 338562516

checkpoint-6750/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:01f84947970e552ffabfbe429853900b1c1be0117da117381b7530447cf7c7e5
+size 677518143

checkpoint-6750/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9f50b1aea084348a049d7ee3b160a857c65ecdc014a1660a2749bc518499c2ff
+size 14575

checkpoint-6750/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:702e63bad1f9b9cd9db29eac8eb56da4a694a9c22f928b76ab0895383a24025d
+size 563

checkpoint-6750/trainer_state.json ADDED Viewed

	@@ -0,0 +1,150 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 3.9799528301886795,
+  "eval_steps": 2250,
+  "global_step": 6750,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.589622641509434,
+      "grad_norm": 9.137022018432617,
+      "learning_rate": 2.9481132075471702e-05,
+      "loss": 2.8435,
+      "step": 1000
+    },
+    {
+      "epoch": 1.179245283018868,
+      "grad_norm": 6.052332401275635,
+      "learning_rate": 5.8962264150943403e-05,
+      "loss": 1.791,
+      "step": 2000
+    },
+    {
+      "epoch": 1.3266509433962264,
+      "eval_accuracy_background": 0.6658729859800179,
+      "eval_accuracy_double_plant": 0.44796971861142204,
+      "eval_accuracy_drydown": 0.838452272819733,
+      "eval_accuracy_endrow": 0.6564099936974693,
+      "eval_accuracy_nutrient_deficiency": 0.5255760511997533,
+      "eval_accuracy_planter_skip": 0.7062276764551357,
+      "eval_accuracy_water": 0.9873387227342924,
+      "eval_accuracy_waterway": 0.5770296385642565,
+      "eval_accuracy_weed_cluster": 0.4428120632960455,
+      "eval_iou_background": 0.5904190410028399,
+      "eval_iou_double_plant": 0.21713659970128166,
+      "eval_iou_drydown": 0.5191145408680865,
+      "eval_iou_endrow": 0.146705809299966,
+      "eval_iou_nutrient_deficiency": 0.3433700256479391,
+      "eval_iou_planter_skip": 0.19867844175237825,
+      "eval_iou_water": 0.3151796347651091,
+      "eval_iou_waterway": 0.17710299517028666,
+      "eval_iou_weed_cluster": 0.2871479144864637,
+      "eval_loss": 1.6307891607284546,
+      "eval_mean_accuracy": 0.6497432359286807,
+      "eval_mean_iou": 0.31053944474381673,
+      "eval_overall_accuracy": 0.6703095203666921,
+      "eval_runtime": 550.4413,
+      "eval_samples_per_second": 15.489,
+      "eval_steps_per_second": 0.485,
+      "step": 2250
+    },
+    {
+      "epoch": 1.7688679245283019,
+      "grad_norm": 10.023482322692871,
+      "learning_rate": 8.84433962264151e-05,
+      "loss": 1.5821,
+      "step": 3000
+    },
+    {
+      "epoch": 2.358490566037736,
+      "grad_norm": 3.805853843688965,
+      "learning_rate": 9.990216178505835e-05,
+      "loss": 1.4645,
+      "step": 4000
+    },
+    {
+      "epoch": 2.6533018867924527,
+      "eval_accuracy_background": 0.6928149295345922,
+      "eval_accuracy_double_plant": 0.520600810240665,
+      "eval_accuracy_drydown": 0.9041661302317083,
+      "eval_accuracy_endrow": 0.41216652623141536,
+      "eval_accuracy_nutrient_deficiency": 0.5572999343661789,
+      "eval_accuracy_planter_skip": 0.5885655971148109,
+      "eval_accuracy_water": 0.9012349964392468,
+      "eval_accuracy_waterway": 0.5122856732827319,
+      "eval_accuracy_weed_cluster": 0.3529035479823603,
+      "eval_iou_background": 0.6154372685119965,
+      "eval_iou_double_plant": 0.286691279808622,
+      "eval_iou_drydown": 0.5005889595647872,
+      "eval_iou_endrow": 0.23071917367118422,
+      "eval_iou_nutrient_deficiency": 0.34903960157986247,
+      "eval_iou_planter_skip": 0.3404743586046269,
+      "eval_iou_water": 0.4866735755203849,
+      "eval_iou_waterway": 0.17740336931417308,
+      "eval_iou_weed_cluster": 0.25445442999377565,
+      "eval_loss": 1.6076184511184692,
+      "eval_mean_accuracy": 0.6046709050470789,
+      "eval_mean_iou": 0.36016466850771256,
+      "eval_overall_accuracy": 0.6938899108737494,
+      "eval_runtime": 529.8506,
+      "eval_samples_per_second": 16.091,
+      "eval_steps_per_second": 0.504,
+      "step": 4500
+    },
+    {
+      "epoch": 2.94811320754717,
+      "grad_norm": 3.9986305236816406,
+      "learning_rate": 9.931699497285711e-05,
+      "loss": 1.3957,
+      "step": 5000
+    },
+    {
+      "epoch": 3.5377358490566038,
+      "grad_norm": 2.7372334003448486,
+      "learning_rate": 9.821001342355031e-05,
+      "loss": 1.3124,
+      "step": 6000
+    },
+    {
+      "epoch": 3.9799528301886795,
+      "eval_accuracy_background": 0.6307230231497055,
+      "eval_accuracy_double_plant": 0.48486363452173786,
+      "eval_accuracy_drydown": 0.8612367898895216,
+      "eval_accuracy_endrow": 0.5075110635399532,
+      "eval_accuracy_nutrient_deficiency": 0.6861430352037324,
+      "eval_accuracy_planter_skip": 0.6031976315027698,
+      "eval_accuracy_water": 0.9802194342104156,
+      "eval_accuracy_waterway": 0.48897799511586637,
+      "eval_accuracy_weed_cluster": 0.556708376519504,
+      "eval_iou_background": 0.5741567963414517,
+      "eval_iou_double_plant": 0.2860919486620036,
+      "eval_iou_drydown": 0.5029587941632667,
+      "eval_iou_endrow": 0.22521629078173816,
+      "eval_iou_nutrient_deficiency": 0.3596590524564408,
+      "eval_iou_planter_skip": 0.3023475517768152,
+      "eval_iou_water": 0.41466030404934484,
+      "eval_iou_waterway": 0.11905712637247004,
+      "eval_iou_weed_cluster": 0.3161136298740651,
+      "eval_loss": 1.6003777980804443,
+      "eval_mean_accuracy": 0.6443978870725785,
+      "eval_mean_iou": 0.34447349938639954,
+      "eval_overall_accuracy": 0.6672287911844751,
+      "eval_runtime": 529.5311,
+      "eval_samples_per_second": 16.101,
+      "eval_steps_per_second": 0.504,
+      "step": 6750
+    }
+  ],
+  "logging_steps": 1000,
+  "max_steps": 33920,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 20,
+  "save_steps": 2250,
+  "total_flos": 1.1495460697287111e+20,
+  "train_batch_size": 32,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-6750/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5f718e0633b4eda2deeb786176aa261e6cae5f387b8ef2e8fb286f958ed2885d
+size 4539