lvcalucioli commited on
Commit
9f39d5f
1 Parent(s): 010511b

flan-t5-large_question_answering_finetuining

Browse files
Files changed (3) hide show
  1. README.md +28 -19
  2. model.safetensors +1 -1
  3. training_args.bin +2 -2
README.md CHANGED
@@ -17,13 +17,22 @@ should probably proofread and complete it, then remove this comment. -->
17
 
18
  This model is a fine-tuned version of [google/flan-t5-large](https://huggingface.co/google/flan-t5-large) on the None dataset.
19
  It achieves the following results on the evaluation set:
20
- - Loss: 0.6768
21
- - Rouge1: 16.22
22
- - Rouge2: 9.65
23
- - Rougel: 15.62
24
- - Rougelsum: 15.75
25
- - R: 13.82
26
- - Gen Len: 30.3456
 
 
 
 
 
 
 
 
 
27
 
28
  ## Model description
29
 
@@ -52,18 +61,18 @@ The following hyperparameters were used during training:
52
 
53
  ### Training results
54
 
55
- | Training Loss | Epoch | Step | Validation Loss | Rouge1 | Rouge2 | Rougel | Rougelsum | R | Gen Len |
56
- |:-------------:|:-----:|:----:|:---------------:|:------:|:------:|:------:|:---------:|:-----:|:-------:|
57
- | 10.4307 | 1.0 | 79 | 0.5836 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 2.0 |
58
- | 0.4454 | 2.0 | 158 | 0.4834 | 4.07 | 0.61 | 4.18 | 4.15 | 2.95 | 13.7574 |
59
- | 0.3152 | 3.0 | 237 | 0.4520 | 7.89 | 2.42 | 7.49 | 7.53 | 5.93 | 27.9044 |
60
- | 0.2321 | 4.0 | 316 | 0.4634 | 7.5 | 3.24 | 7.41 | 7.39 | 6.05 | 20.0588 |
61
- | 0.1775 | 5.0 | 395 | 0.4656 | 12.1 | 5.52 | 11.98 | 11.81 | 9.86 | 21.1176 |
62
- | 0.1299 | 6.0 | 474 | 0.4958 | 15.28 | 8.79 | 14.71 | 14.68 | 12.92 | 22.9044 |
63
- | 0.096 | 7.0 | 553 | 0.5332 | 15.42 | 9.23 | 14.84 | 14.94 | 13.15 | 28.3382 |
64
- | 0.0685 | 8.0 | 632 | 0.6132 | 15.45 | 9.76 | 15.07 | 14.99 | 13.42 | 26.4559 |
65
- | 0.0542 | 9.0 | 711 | 0.6218 | 17.08 | 11.34 | 16.54 | 16.67 | 14.98 | 28.2353 |
66
- | 0.0442 | 10.0 | 790 | 0.6768 | 16.22 | 9.65 | 15.62 | 15.75 | 13.82 | 30.3456 |
67
 
68
 
69
  ### Framework versions
 
17
 
18
  This model is a fine-tuned version of [google/flan-t5-large](https://huggingface.co/google/flan-t5-large) on the None dataset.
19
  It achieves the following results on the evaluation set:
20
+ - Loss: 0.5047
21
+ - Rouge1: 22.91
22
+ - Rouge2: 15.73
23
+ - Rougel: 22.88
24
+ - Rougelsum: 22.51
25
+ - R: 20.48
26
+ - Gen Len: 28.875
27
+ - R@1: 0.0074
28
+ - R@3: 0.0147
29
+ - R@5: 0.0221
30
+ - R@10: 0.0294
31
+ - R@20: 0.0588
32
+ - R@50: 0.0735
33
+ - Sample: [{'correct_answer': 'Si, queste provvedono a trovare una centrale di committenza', 'prediction': 'S, solo per le attività di centralizzazione delle committenze svolte nella forma di acquisizione centralizzata di forniture e/o servizi a stazioni appaltanti'}]
34
+ - Model Name: google/flan-t5-large_question-answering
35
+ - Datetime: 2024-02-17T17:53:18.801690
36
 
37
  ## Model description
38
 
 
61
 
62
  ### Training results
63
 
64
+ | Training Loss | Epoch | Step | Validation Loss | Rouge1 | Rouge2 | Rougel | Rougelsum | R | Gen Len | R@1 | R@3 | R@5 | R@10 | R@20 | R@50 | Sample | Model Name | Datetime |
65
+ |:-------------:|:-----:|:----:|:---------------:|:------:|:------:|:------:|:---------:|:-----:|:-------:|:------:|:------:|:------:|:------:|:------:|:------:|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------:|:---------------------------------------:|:--------------------------:|
66
+ | 5.0871 | 1.0 | 79 | 0.4577 | 0.42 | 0.0 | 0.39 | 0.4 | 0.27 | 54.1912 | 0.0 | 0.0 | 0.0147 | 0.0221 | 0.0588 | 0.1397 | [{'correct_answer': 'i quali i quali i quali i quali i quali i quali i quali i quali i quali i quali i quali i quali i quali i quali i quali i quali i quali i quali i quali i qual', 'prediction': "si assume ogni responsabilità con riferimento alla scelta, alla nomina ed all'attività svolta da quest'ultimo"}] | google/flan-t5-large_question-answering | 2024-02-17T17:29:21.450118 |
67
+ | 0.4213 | 2.0 | 158 | 0.3912 | 6.43 | 1.46 | 6.29 | 6.32 | 4.72 | 27.3015 | 0.0 | 0.0074 | 0.0074 | 0.0147 | 0.0588 | 0.0882 | [{'correct_answer': 'La selezione dei criteri di aggiudicazione', 'prediction': 'Non vi è decadenza della commissione, che rimane in carica'}] | google/flan-t5-large_question-answering | 2024-02-17T17:31:55.211478 |
68
+ | 0.3103 | 3.0 | 237 | 0.3607 | 7.68 | 2.82 | 7.29 | 7.25 | 5.93 | 20.9412 | 0.0 | 0.0074 | 0.0221 | 0.0294 | 0.0588 | 0.1029 | [{'correct_answer': "l'appalto", 'prediction': 'con determina del responsabile del servizio'}] | google/flan-t5-large_question-answering | 2024-02-17T17:34:29.912334 |
69
+ | 0.2361 | 4.0 | 316 | 0.3687 | 13.83 | 8.09 | 13.15 | 13.18 | 11.68 | 23.7132 | 0.0 | 0.0 | 0.0 | 0.0147 | 0.0588 | 0.0809 | [{'correct_answer': 'il MEPA', 'prediction': 'Appositi bandi'}] | google/flan-t5-large_question-answering | 2024-02-17T17:37:24.187657 |
70
+ | 0.1798 | 5.0 | 395 | 0.3812 | 16.46 | 9.57 | 15.77 | 15.68 | 13.92 | 23.5294 | 0.0 | 0.0147 | 0.0147 | 0.0294 | 0.0515 | 0.0882 | [{'correct_answer': 'aggiudicate', 'prediction': 'pubblicano un avviso di indizione di gara precisando che si tratta di un sistema dinamico di acquisizione'}] | google/flan-t5-large_question-answering | 2024-02-17T17:39:48.557761 |
71
+ | 0.1321 | 6.0 | 474 | 0.3842 | 14.35 | 8.64 | 13.83 | 13.72 | 12.27 | 25.1838 | 0.0074 | 0.0074 | 0.0147 | 0.0221 | 0.0368 | 0.0515 | [{'correct_answer': 'il programma degli acquisti di beni e servizi', 'prediction': 'biennale'}] | google/flan-t5-large_question-answering | 2024-02-17T17:41:35.990230 |
72
+ | 0.0979 | 7.0 | 553 | 0.4148 | 18.94 | 11.37 | 18.33 | 18.31 | 16.19 | 33.9265 | 0.0147 | 0.0221 | 0.0221 | 0.0294 | 0.0515 | 0.0882 | [{'correct_answer': 'S, sempre', 'prediction': 'No, solo in caso di procedura negoziata e procedura aperta'}] | google/flan-t5-large_question-answering | 2024-02-17T17:44:30.313311 |
73
+ | 0.0705 | 8.0 | 632 | 0.4445 | 21.22 | 14.84 | 21.01 | 20.93 | 19.01 | 27.6618 | 0.0074 | 0.0074 | 0.0074 | 0.0368 | 0.0515 | 0.0809 | [{'correct_answer': "Attraverso una garanzia definitiva del 10 per cento dell'importo contrattuale", 'prediction': "S, è obbligatorio richiedere il codice CIG, ai fini della tracciabilità, per tutti i contratti di lavori, servizi e forniture, a prescindere dall'importo degli stessi e dalle modalità di affidamento e quindi anche per i contratti esclusi dall'obbligo del versamento del contributo in favore dell'Autorità"}] | google/flan-t5-large_question-answering | 2024-02-17T17:46:55.226383 |
74
+ | 0.0554 | 9.0 | 711 | 0.4899 | 21.88 | 14.93 | 21.74 | 21.37 | 19.5 | 29.1029 | 0.0074 | 0.0147 | 0.0221 | 0.0368 | 0.0515 | 0.0809 | [{'correct_answer': 'Si, queste provvedono ad acquistare beni o servizi di importo pari o superiore a un milione di euro', 'prediction': 'No, gli acquisti in MEPA devono essere fatti al di sotto la soglia minima comunitaria'}] | google/flan-t5-large_question-answering | 2024-02-17T17:51:16.632401 |
75
+ | 0.0438 | 10.0 | 790 | 0.5047 | 22.91 | 15.73 | 22.88 | 22.51 | 20.48 | 28.875 | 0.0074 | 0.0147 | 0.0221 | 0.0294 | 0.0588 | 0.0735 | [{'correct_answer': 'Si, queste provvedono a trovare una centrale di committenza', 'prediction': 'S, solo per le attività di centralizzazione delle committenze svolte nella forma di acquisizione centralizzata di forniture e/o servizi a stazioni appaltanti'}] | google/flan-t5-large_question-answering | 2024-02-17T17:53:18.801690 |
76
 
77
 
78
  ### Framework versions
model.safetensors CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:1b5ba7b739f94e8120d7eb9745d63c45ca58cce0d8d80c979af178a6f02e207c
3
  size 3132668808
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:0757e6dd4b183f9b498f16d76daefbf4ff116e7d22a8d5a9d142a3289d90e2d3
3
  size 3132668808
training_args.bin CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:02553c4f3ca4dd9be731208174a143814b6582342208f2cc0c7d37b119cccf60
3
- size 4603
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:85faf1b4b03d3454d05bb50542e0f594ec214d28fcce15369e56c1446643295f
3
+ size 4539