WKLI22
/

detr-resnet-50_finetuned_cppe5

@@ -15,7 +15,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [WKLI22/detr-resnet-50_finetuned_cppe5](https://huggingface.co/WKLI22/detr-resnet-50_finetuned_cppe5) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.4986
 ## Model description
@@ -35,67 +35,88 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 1e-05
-- train_batch_size: 17
-- eval_batch_size: 17
 - seed: 42
-- gradient_accumulation_steps: 6
-- total_train_batch_size: 102
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 3
 - mixed_precision_training: Native AMP
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 0.4724        | 0.07  | 2    | 0.5355          |
-| 0.4907        | 0.14  | 4    | 0.5277          |
-| 0.498         | 0.21  | 6    | 0.5214          |
-| 0.534         | 0.28  | 8    | 0.5274          |
-| 0.5305        | 0.36  | 10   | 0.5294          |
-| 0.5096        | 0.43  | 12   | 0.5273          |
-| 0.5149        | 0.5   | 14   | 0.5158          |
-| 0.5099        | 0.57  | 16   | 0.5163          |
-| 0.5308        | 0.64  | 18   | 0.5217          |
-| 0.5164        | 0.71  | 20   | 0.5076          |
-| 0.4932        | 0.78  | 22   | 0.5050          |
-| 0.5151        | 0.85  | 24   | 0.5102          |
-| 0.4982        | 0.92  | 26   | 0.5044          |
-| 0.526         | 0.99  | 28   | 0.5096          |
-| 0.5034        | 1.07  | 30   | 0.4980          |
-| 0.5155        | 1.14  | 32   | 0.5067          |
-| 0.513         | 1.21  | 34   | 0.5011          |
-| 0.5019        | 1.28  | 36   | 0.5066          |
-| 0.4704        | 1.35  | 38   | 0.5094          |
-| 0.5404        | 1.42  | 40   | 0.5126          |
-| 0.5263        | 1.49  | 42   | 0.5062          |
-| 0.4729        | 1.56  | 44   | 0.5223          |
-| 0.5032        | 1.63  | 46   | 0.5073          |
-| 0.476         | 1.7   | 48   | 0.5111          |
-| 0.4823        | 1.78  | 50   | 0.5094          |
-| 0.5223        | 1.85  | 52   | 0.5042          |
-| 0.4855        | 1.92  | 54   | 0.4962          |
-| 0.5038        | 1.99  | 56   | 0.5006          |
-| 0.5196        | 2.06  | 58   | 0.5022          |
-| 0.4847        | 2.13  | 60   | 0.4943          |
-| 0.4697        | 2.2   | 62   | 0.5007          |
-| 0.4893        | 2.27  | 64   | 0.5041          |
-| 0.4939        | 2.34  | 66   | 0.4910          |
-| 0.5093        | 2.41  | 68   | 0.4974          |
-| 0.4884        | 2.49  | 70   | 0.4962          |
-| 0.5087        | 2.56  | 72   | 0.5081          |
-| 0.4889        | 2.63  | 74   | 0.4974          |
-| 0.486         | 2.7   | 76   | 0.5003          |
-| 0.4747        | 2.77  | 78   | 0.4917          |
-| 0.5028        | 2.84  | 80   | 0.4849          |
-| 0.5366        | 2.91  | 82   | 0.4931          |
-| 0.5083        | 2.98  | 84   | 0.4986          |
 ### Framework versions
-- Transformers 4.38.2
-- Pytorch 2.2.1+cu121
 - Datasets 2.18.0
 - Tokenizers 0.15.2

 This model is a fine-tuned version of [WKLI22/detr-resnet-50_finetuned_cppe5](https://huggingface.co/WKLI22/detr-resnet-50_finetuned_cppe5) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.3434
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 1e-05
+- train_batch_size: 20
+- eval_batch_size: 20
 - seed: 42
+- gradient_accumulation_steps: 8
+- total_train_batch_size: 160
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 10
 - mixed_precision_training: Native AMP
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 0.4846        | 0.16  | 10   | 0.5442          |
+| 0.4586        | 0.32  | 20   | 0.4547          |
+| 0.4353        | 0.48  | 30   | 0.4394          |
+| 0.4028        | 0.63  | 40   | 0.4095          |
+| 0.3903        | 0.79  | 50   | 0.4123          |
+| 0.3914        | 0.95  | 60   | 0.4078          |
+| 0.3802        | 1.11  | 70   | 0.3960          |
+| 0.3903        | 1.27  | 80   | 0.3850          |
+| 0.4412        | 1.43  | 90   | 0.3924          |
+| 0.3671        | 1.59  | 100  | 0.3832          |
+| 0.412         | 1.75  | 110  | 0.3629          |
+| 0.3625        | 1.9   | 120  | 0.3593          |
+| 0.3588        | 2.06  | 130  | 0.3533          |
+| 0.3598        | 2.22  | 140  | 0.3525          |
+| 0.404         | 2.38  | 150  | 0.3428          |
+| 0.3519        | 2.54  | 160  | 0.3375          |
+| 0.3647        | 2.7   | 170  | 0.3352          |
+| 0.3669        | 2.86  | 180  | 0.3509          |
+| 0.3695        | 3.02  | 190  | 0.3452          |
+| 0.341         | 3.17  | 200  | 0.3614          |
+| 0.3798        | 3.33  | 210  | 0.3589          |
+| 0.3421        | 3.49  | 220  | 0.3646          |
+| 0.3541        | 3.65  | 230  | 0.3562          |
+| 0.4168        | 3.81  | 240  | 0.3584          |
+| 0.3423        | 3.97  | 250  | 0.3508          |
+| 0.3548        | 4.13  | 260  | 0.3339          |
+| 0.3854        | 4.29  | 270  | 0.3424          |
+| 0.3435        | 4.44  | 280  | 0.3353          |
+| 0.4037        | 4.6   | 290  | 0.3408          |
+| 0.3741        | 4.76  | 300  | 0.3317          |
+| 0.3454        | 4.92  | 310  | 0.3112          |
+| 0.3717        | 5.08  | 320  | 0.3211          |
+| 0.3695        | 5.24  | 330  | 0.3424          |
+| 0.3379        | 5.4   | 340  | 0.3321          |
+| 0.3516        | 5.56  | 350  | 0.3441          |
+| 0.3672        | 5.71  | 360  | 0.3307          |
+| 0.3842        | 5.87  | 370  | 0.3414          |
+| 0.3385        | 6.03  | 380  | 0.3386          |
+| 0.3613        | 6.19  | 390  | 0.3248          |
+| 0.3542        | 6.35  | 400  | 0.3217          |
+| 0.3509        | 6.51  | 410  | 0.3180          |
+| 0.3532        | 6.67  | 420  | 0.3217          |
+| 0.3426        | 6.83  | 430  | 0.3393          |
+| 0.3476        | 6.98  | 440  | 0.3400          |
+| 0.3384        | 7.14  | 450  | 0.3334          |
+| 0.3568        | 7.3   | 460  | 0.3300          |
+| 0.3253        | 7.46  | 470  | 0.3414          |
+| 0.3453        | 7.62  | 480  | 0.3367          |
+| 0.3507        | 7.78  | 490  | 0.3340          |
+| 0.3198        | 7.94  | 500  | 0.3213          |
+| 0.3121        | 8.1   | 510  | 0.3448          |
+| 0.3492        | 8.25  | 520  | 0.3426          |
+| 0.3382        | 8.41  | 530  | 0.3392          |
+| 0.3498        | 8.57  | 540  | 0.3433          |
+| 0.3504        | 8.73  | 550  | 0.3520          |
+| 0.3255        | 8.89  | 560  | 0.3370          |
+| 0.3294        | 9.05  | 570  | 0.3390          |
+| 0.3325        | 9.21  | 580  | 0.3392          |
+| 0.3304        | 9.37  | 590  | 0.3358          |
+| 0.3393        | 9.52  | 600  | 0.3415          |
+| 0.3198        | 9.68  | 610  | 0.3388          |
+| 0.3576        | 9.84  | 620  | 0.3352          |
+| 0.3801        | 10.0  | 630  | 0.3434          |
 ### Framework versions
+- Transformers 4.39.3
+- Pytorch 2.2.2+cu121
 - Datasets 2.18.0
 - Tokenizers 0.15.2

config.json CHANGED Viewed

@@ -47,7 +47,7 @@
   "position_embedding_type": "sine",
   "scale_embedding": false,
   "torch_dtype": "float32",
-  "transformers_version": "4.38.2",
   "use_pretrained_backbone": true,
   "use_timm_backbone": true
 }

   "position_embedding_type": "sine",
   "scale_embedding": false,
   "torch_dtype": "float32",
+  "transformers_version": "4.39.3",
   "use_pretrained_backbone": true,
   "use_timm_backbone": true
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e6c887eeb192d1471dc373a582b282640c4cd0c2ead96dd6e1c44e9fe63e9331
 size 166494824

 version https://git-lfs.github.com/spec/v1
+oid sha256:9bb901a438a1ff82f3f67260519f3be47b3d42bf586432860bbe6af59cac232c
 size 166494824

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c4a10acbaab52f350a8e4085ab48ae1d3174b89779ca7ebc3192553df612a4fa
 size 4920

 version https://git-lfs.github.com/spec/v1
+oid sha256:af6e70331c668d3add0c125ed07e353e45663ac0747389cbbd5eb5376bceed23
 size 4920