teami12 commited on
Commit
7c12f00
·
verified ·
1 Parent(s): 8d7c735

Upload folder using huggingface_hub

Browse files
.gitattributes CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 768,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,832 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ datasets: []
3
+ language: []
4
+ library_name: sentence-transformers
5
+ metrics:
6
+ - cosine_accuracy@1
7
+ - cosine_accuracy@3
8
+ - cosine_accuracy@5
9
+ - cosine_accuracy@10
10
+ - cosine_precision@1
11
+ - cosine_precision@3
12
+ - cosine_precision@5
13
+ - cosine_precision@10
14
+ - cosine_recall@1
15
+ - cosine_recall@3
16
+ - cosine_recall@5
17
+ - cosine_recall@10
18
+ - cosine_ndcg@10
19
+ - cosine_mrr@10
20
+ - cosine_map@100
21
+ - dot_accuracy@1
22
+ - dot_accuracy@3
23
+ - dot_accuracy@5
24
+ - dot_accuracy@10
25
+ - dot_precision@1
26
+ - dot_precision@3
27
+ - dot_precision@5
28
+ - dot_precision@10
29
+ - dot_recall@1
30
+ - dot_recall@3
31
+ - dot_recall@5
32
+ - dot_recall@10
33
+ - dot_ndcg@10
34
+ - dot_mrr@10
35
+ - dot_map@100
36
+ pipeline_tag: sentence-similarity
37
+ tags:
38
+ - sentence-transformers
39
+ - sentence-similarity
40
+ - feature-extraction
41
+ - generated_from_trainer
42
+ - dataset_size:9371
43
+ - loss:MultipleNegativesRankingLoss
44
+ widget:
45
+ - source_sentence: anKoji su demografski podaci za različite periode?
46
+ sentences:
47
+ - 'Koeficijent broja stanovništva 2013/1991 (Autor prema: (FZSGrafikon A.14. Koeficijent
48
+ broja stanovništva 2013/1953 (Autor prema: (FZSGrafikon A.15. Procenat gradske
49
+ populacije u ukupnoj populaciji JLS u periodu Grafikon A.16. Procentulani udeo
50
+ populacije grada i sela za popisne godine 1953, Grafikon A.17. Žrtve rata 1992-1995
51
+ na nivou JLS (Autor prema: (Tokača, 2012)) 397 Grafikon A.18. Žrtve rata 1992-1995,
52
+ procentualni gubici u odnosu na populaciju Grafikon A.19. Domaćinstva JLS, gradova
53
+ i sela SZ regiona RS prema zvaničnim popisima iz 1953, 1971, 1991 i 2013 godine
54
+ (Autor prema: (SZS-SFRJ, 1975; FZSGrafikon A.20. Rast/pad broja domaćinstava na
55
+ nivou grada i sela za periode 1953'
56
+ - ' Naravno, na kraju se postavlja pitanje ko je odgovoran za ovako poražavajuće
57
+ podatke i stanje bezbednosti saobraćaja u Srbiji? U zaključcima sa gore pomenute
58
+ konferencije prisutni učesnici su se složili da su ovako loši rezultati posledica
59
+ nerada i slabe koordinacije i saradnje najvažnijih subjekata bezbednosti saobraćaja
60
+ Strategija bezbednosti saobraćaja je definisala da su „Najvažniji subjekti bezbednosti
61
+ saobraćaja u Republici Srbiji: Vlada, ministarstvo nadležno za poslove saobraćaja
62
+ i Ministarstvo unutrašnjih poslova, kao nosioci izvršne vlasti i kao organi odgovorni
63
+ za stanje bezbednosti saobraćaja u državi“'
64
+ - ' - 70 - Slika 3-6 Načini vraćanja podataka u okviru podsistema za prikaz rezuultata
65
+ Slika 4-4 Pad pritiska na filterskom elementu u zavisnosti od protoka - 80 -
66
+ Slika 4-5 Porast pada pritiska na filterskom elementu usled povećanja Slika 4-6
67
+ Ušteda koja se postiže redovnom zamenom filterskog elementa - Slika 4-13 Uputstvo
68
+ za zamenu filterskog elementa u formi proširene Slika 4-19 Uputstvo za servisiranje
69
+ pneumatskog cilindra u formi proširene Slika 4-21 Notifikacija sa informacijom
70
+ o oštećenju ležaja trofaznog Slika 4-22 Uputstvo za servisiranje trofaznog asinhronog
71
+ motora u formi Sve veći broj kriterijuma koja su industrijska postrojenja morala
72
+ da zadovolje (produktivnost, efikasnost, smanjenje troškova, smanjenje zagađenja,
73
+ itd'
74
+ - source_sentence: anKo je komponovao Sedmu Simfoniju u C-Duru?
75
+ sentences:
76
+ - 'Ne govori više; meni se krv na oči navukla, i ja moram učiniti što sam namislio.“
77
+ Posle toga poćuti malo, na posle tresući so progovori: „Hajde sa mnom ako hoćeš,
78
+ ako ne, ja ću ići sam.“ „Do zore ćemo se dovući do kuće moga dušmanina g. Lacike.
79
+ Ako ga nađemo kod kuće, on mora umreti; ako ne, od njegove kuće neće ostati kamen
80
+ na kamenu.“ „Ništa, ne govori ništa. Ako si moj drug, a ti mi budi u nevolji;
81
+ a ako se bojiš kroz madžarsku vojsku prolaziti, a ti ostaj, ja ću i sam otići.“
82
+ I ne čekavši odgovora pođe. Moje lepe čitateljke znaju zašto su oni došli. Petar
83
+ videvši Ružu zadrkće se, neka ga jeza obuzme i stajaše okamenjen na svome mestu.
84
+ Ali Stevan koji bejaše mnogo nemilostiviji nego Petar priđe k Ruži, uhvati je
85
+ za ruku i goropadno poviče: „Ustani, gospođo, pa nas vodi.“ Ruža bejaše bleda
86
+ kao smrt, koje od slabosti i teške žalosti koju je pretrpela, koje opet od straha.
87
+ „Kuda?“ zapita drkćući. „Gospodinu Laciki,“ reče Stevan.'
88
+ - ' Žana Sibelijusa Sedma Simfonija, C-Dur, opus 105, poslednja je Sibelijusova
89
+ dovršena simfonija (ne računajući izgubljeni manuskript Sibelijusove Osme, pred
90
+ kraj majstorova života), nastala je ubrzo posle Šeste, 1924godine i premijerno
91
+ izvedena u Helsinkiju, pod dirigentskom palicom kompozitora Sa ovom simfonijom,
92
+ Sibelijus je konačno postigao svoj umetnički cilj, koncentraciju muzičkog materijala
93
+ Simfonija je koncipirana u jednom velikom stavu, trajanja 22 minuta, čime se dobija
94
+ karakter simfonijske fantazije'
95
+ - '1a) and b)) had the similar levels or the similar profiles (ie relative percentage
96
+ to the total PCB content) of higher chlorinated indicator PCBs Such grouping phenomenon
97
+ could be explained by homogenous general exposure of the donors The following
98
+ outlier in the first component (PC1) emerged: in the case of PCA with mass concentrations
99
+ it was the 28-years old primiparae from the rural area due to significantly enhanced
100
+ content of highly chlorinated congeners (PCB 118,138,153, and 180), whereas in
101
+ the case of PCA with mass% normalized concentrations, the outliers were the ones
102
+ with highly elevated percentage of PCB 52 relative to the total concentration
103
+ (one primipara (24 years) from rural location as well as two primiparas (20 and
104
+ 22 years) and two secundipars (34 and 36 years) from urban locations)'
105
+ - source_sentence: anKo je bio Fridrih Kalkbrener?
106
+ sentences:
107
+ - ' veka glavna liturgija Carigradske crkve Ona je kraća od Vasilijeve, od koje
108
+ se razlikuje samo po tekstu anaforshih evharistijskih molitava, a koja se služi
109
+ samo deset puta preko godine Postoje svedočanstva koja potvrđuju ne samo autentičnost
110
+ Liturgije Svetog Vasilija Velikog nego i činjenicu da je u 4 veku bila u upotrebi
111
+ na celom Istoku, pa čak i u Carigradu Liturgija pređeosvećenih darova se služi
112
+ 15—18 puta godišnje, samo u toku Velikog posta, koji shodno pravoslavnoj duhovnosti
113
+ sačinjava period pokajanja, to jest ne liturgijski period'
114
+ - ' godine uručen njegovoj ćerki Gordani na skromnoj ceremoniji održanoj u ambasadi
115
+ SAD u Beogradu Odlikovanje nije uručeno sve do tada zato što je američki interes
116
+ na Balkanu bila neutralna Jugoslavija pod Titovom upravom Pretpostavljalo se da
117
+ bi jedan ovakav čin gurnuo Jugoslaviju u naručje Sovjetskom Savezu i da bi ona
118
+ postala članica Varšavskog pakta Vest o dodeli odlikovanja generalu Draži Mihajloviću,
119
+ tačnije o njegovom uručenju Dražinoj ćerki Gordani izazvala je burne reakcije
120
+ u Bosni i Hrvatskoj među onim snagama koje nastoje da Jugoslovensku vojsku u otadžbini
121
+ izjednače sa Ustašama i drugim vojnim formacijama sastavljenim od pripadnika nekadašnjih
122
+ jugoslovenskih naroda koje su operisale na Balkanu'
123
+ - 'To nam dokazuje i činjenica da je pisac Katon Stariji svako svoje izlaganje u
124
+ Senatu završavao rečenicom: "Uostalom, smatram da Kartaginu treba razoriti". Na
125
+ kraju Trećeg punskog rata, Rimljani su to i učinili, i samim tim postali vodeća
126
+ sila zapadnog Sredozemlja. Fridrih Kalkbrener Fridrih Vilhelm Mihael Kalkbrener
127
+ (; na putu iz Kasela ka Berlinu, 7. novembar 1784 — Angjen le Ben, 10. jun 1849)
128
+ je bio nemački pijanist i kompozitor. Sin je Kristijana Kalkbrenera koji je bio
129
+ jevrejski muzičar iz Kasela. U periodu 1945-1947. bio je zatvoren, a potom je
130
+ ponovo radio kao advokat.'
131
+ - source_sentence: anKo je primoran na ostavku?
132
+ sentences:
133
+ - 'Novi sekretar za sport za dva danaNa pitanje novinara kada će biti imenovan novi
134
+ gradski sekretar za sport, gradonačelnik Dragan Đilas rekao je da će to biti u
135
+ toku naredna dva dana. – Upravo se vratio iz inostranstva, a imenovaću ga u naredna
136
+ dva dana – odgovorio je kratko gradonačelnik, ali nije otkrio o kome je reč. Poznato
137
+ 19 učesnikaPoznato je 19 tenisera koji će iz glavnog žreba početi takmičenje na
138
+ „Serbia open 2009“. saopštili su organizatori turnira. Pored Novaka Đokovića,
139
+ Viktora Troickog i Janka Tipsarevića učešće su potvrdili: Radek Štepanek (Češka),
140
+ Igor Andrejev (Rusija), Ivo Karlović, Ivan Ljubičić(Hrvatska), Viktor Hanesku
141
+ (Rumunija), Andreas Sepi (Italija), Sem Kveri (SAD), Marselo Granoleros (Španija),
142
+ Kristof Rohaus, Kristof Vligen (Belgija), Arno Klemon, Nikola Devilder (Francuska),
143
+ Giljermo Kanjas, Leonardo Mejer (Argentina), Nikolas Masu (Čile), Daniel Markos
144
+ (Brazil).'
145
+ - ' Područja socijalnog rada određuju specifičnost primene metoda, tehnika i veština
146
+ socijalnog rada na određenu kategoriju klijenata Socijalne usluge obuhvataju mrežu
147
+ institucija, organizacija i službi formiranih radi promocije zdravlja i dobrobiti
148
+ građana Usluge mogu biti raznolike i uključuju pomaganje ljudima da postanu nezavisni
149
+ do stepena do kojeg je to moguće, pravnu pomoć, bračno savetovanje, grupe građana
150
+ za podršku, zastupanje, ostvarivanje finansijske pomoći, nadzor nad decom, povezivanje
151
+ klijenata sa resursima, savetovanje i drugo'
152
+ - U tako teškoj situaciji prvi put od početka rata sazvana je Narodna skupština,
153
+ koja je primorala vladu [[Milo Matanović|Mila Matanovića]] na ostavku Odlučeno
154
+ je da bi Crna Gora trebalo da se ugleda na primjer Srbije, da borbom kupuje vrijeme
155
+ za povlačenje Kralj Nikola je jedva uspio da imenuje novu vladu Lazara Mijuškovića
156
+ U decembru 1915 godine kralj Nikola je pokušao da pregovara sa Austrougarskom
157
+ oko separatnog mira čime je izgubio kredibilitet pred silama Antante
158
+ - source_sentence: anKo će besplatno boraviti u vrtićima?
159
+ sentences:
160
+ - Roditelji, njih 4127, zbog promene materijalnog statusa plaćaće najvišu cenu,
161
+ a zbog nepotpune dokumentacije, naknadno će biti urađeno još 376 rešenja Kako
162
+ je u celodnevni boravak do sada upisano 47800 mališana, 15800 roditelja nije ni
163
+ podnelo zahteve, jer su pretpostavili da zbog visine mesečnih primanja ne bi ni
164
+ mogli da ostvare neki od popusta – U vrtićima će besplatno boraviti 248 dece koja
165
+ žive u socijalno ugroženim porodicama, čije su porodice korisnici materijalnog
166
+ obezbeđenja porodice ili se nalaze u Sigurnoj kući
167
+ - ' Na sastanku će danas na dnevnom redu biti rasprava o integrisanoj kontroli granica,
168
+ slobodi kretanja i pravosuđa, dok će sutra delegacije razgovarati o Zajednici
169
+ srpskih opština, energetici i Ibarskom mostu Delegaciju Beograda predvodi direktor
170
+ Kancelarije za Kosovo i Metohiju Marko Đurić, dok je na čelu delegacije Prištine
171
+ glavni pregovarač Avni Arifi U delegaciji Beograda, pored predstavnika Kancelarije
172
+ za Kosovo i Metohiju i Kancelarije za koordinacione poslove u pregovaračkom procesu
173
+ sa privremenim institucijama samouprave u Prištini, biće i predstavnici nadležnih
174
+ ministarstava i institucija po navedenim temama, javlja RTS'
175
+ - Pored dobro poznatih isparljivih terpena, polifenolna jedinjenja Doktorska disertacija
176
+ 22 rastvorna u vodi, kao što su derivati benzoeve i cimetne kiseline, mogu poslužiti
177
+ kao alelopatske supstance. Polifenolna jedinjenja mogu biti i signalni molekuli
178
+ u interakcijama biljke i bakterija koje fiksiraju azot kod mahunarki (Strack,
179
+ 1997). Značajna uloga flavonoida i fenolnih kiselina je njihovo učešće u odbrambenom
180
+ mehanizmu biljke. Dokazano je da se u uslovima stresa (prekomerno UV zračenje,
181
+ oštećenje tkiva, infekcija) u biljkama indukuje sinteza polifenolnih jedinjenja
182
+ (Britton, 1983; Dixon i Paiva, 1995). Polifenolna jedinjenja se mogu akumulirati
183
+ pre i posle napada mikroorganizama. Pre infekcije su u formi toksina, dok su postinfekcijska
184
+ polifenolna jedinjenja u fromi tzv. fitoaleksina.
185
+ model-index:
186
+ - name: SentenceTransformer
187
+ results:
188
+ - task:
189
+ type: information-retrieval
190
+ name: Information Retrieval
191
+ dataset:
192
+ name: sts dev
193
+ type: sts-dev
194
+ metrics:
195
+ - type: cosine_accuracy@1
196
+ value: 0.7673922321809645
197
+ name: Cosine Accuracy@1
198
+ - type: cosine_accuracy@3
199
+ value: 0.8834827144686299
200
+ name: Cosine Accuracy@3
201
+ - type: cosine_accuracy@5
202
+ value: 0.9206145966709347
203
+ name: Cosine Accuracy@5
204
+ - type: cosine_accuracy@10
205
+ value: 0.9492104139991464
206
+ name: Cosine Accuracy@10
207
+ - type: cosine_precision@1
208
+ value: 0.7673922321809645
209
+ name: Cosine Precision@1
210
+ - type: cosine_precision@3
211
+ value: 0.29449423815621
212
+ name: Cosine Precision@3
213
+ - type: cosine_precision@5
214
+ value: 0.18412291933418692
215
+ name: Cosine Precision@5
216
+ - type: cosine_precision@10
217
+ value: 0.09492104139991463
218
+ name: Cosine Precision@10
219
+ - type: cosine_recall@1
220
+ value: 0.7673922321809645
221
+ name: Cosine Recall@1
222
+ - type: cosine_recall@3
223
+ value: 0.8834827144686299
224
+ name: Cosine Recall@3
225
+ - type: cosine_recall@5
226
+ value: 0.9206145966709347
227
+ name: Cosine Recall@5
228
+ - type: cosine_recall@10
229
+ value: 0.9492104139991464
230
+ name: Cosine Recall@10
231
+ - type: cosine_ndcg@10
232
+ value: 0.8601780692125409
233
+ name: Cosine Ndcg@10
234
+ - type: cosine_mrr@10
235
+ value: 0.8313636024903625
236
+ name: Cosine Mrr@10
237
+ - type: cosine_map@100
238
+ value: 0.8333518185193245
239
+ name: Cosine Map@100
240
+ - type: dot_accuracy@1
241
+ value: 0.7673922321809645
242
+ name: Dot Accuracy@1
243
+ - type: dot_accuracy@3
244
+ value: 0.8834827144686299
245
+ name: Dot Accuracy@3
246
+ - type: dot_accuracy@5
247
+ value: 0.9206145966709347
248
+ name: Dot Accuracy@5
249
+ - type: dot_accuracy@10
250
+ value: 0.9492104139991464
251
+ name: Dot Accuracy@10
252
+ - type: dot_precision@1
253
+ value: 0.7673922321809645
254
+ name: Dot Precision@1
255
+ - type: dot_precision@3
256
+ value: 0.29449423815621
257
+ name: Dot Precision@3
258
+ - type: dot_precision@5
259
+ value: 0.18412291933418692
260
+ name: Dot Precision@5
261
+ - type: dot_precision@10
262
+ value: 0.09492104139991463
263
+ name: Dot Precision@10
264
+ - type: dot_recall@1
265
+ value: 0.7673922321809645
266
+ name: Dot Recall@1
267
+ - type: dot_recall@3
268
+ value: 0.8834827144686299
269
+ name: Dot Recall@3
270
+ - type: dot_recall@5
271
+ value: 0.9206145966709347
272
+ name: Dot Recall@5
273
+ - type: dot_recall@10
274
+ value: 0.9492104139991464
275
+ name: Dot Recall@10
276
+ - type: dot_ndcg@10
277
+ value: 0.8601780692125409
278
+ name: Dot Ndcg@10
279
+ - type: dot_mrr@10
280
+ value: 0.8313636024903625
281
+ name: Dot Mrr@10
282
+ - type: dot_map@100
283
+ value: 0.8333518185193245
284
+ name: Dot Map@100
285
+ - type: cosine_accuracy@1
286
+ value: 0.7763551002987623
287
+ name: Cosine Accuracy@1
288
+ - type: cosine_accuracy@3
289
+ value: 0.8941527955612463
290
+ name: Cosine Accuracy@3
291
+ - type: cosine_accuracy@5
292
+ value: 0.9253094323516858
293
+ name: Cosine Accuracy@5
294
+ - type: cosine_accuracy@10
295
+ value: 0.9526248399487837
296
+ name: Cosine Accuracy@10
297
+ - type: cosine_precision@1
298
+ value: 0.7763551002987623
299
+ name: Cosine Precision@1
300
+ - type: cosine_precision@3
301
+ value: 0.2980509318537487
302
+ name: Cosine Precision@3
303
+ - type: cosine_precision@5
304
+ value: 0.18506188647033714
305
+ name: Cosine Precision@5
306
+ - type: cosine_precision@10
307
+ value: 0.09526248399487836
308
+ name: Cosine Precision@10
309
+ - type: cosine_recall@1
310
+ value: 0.7763551002987623
311
+ name: Cosine Recall@1
312
+ - type: cosine_recall@3
313
+ value: 0.8941527955612463
314
+ name: Cosine Recall@3
315
+ - type: cosine_recall@5
316
+ value: 0.9253094323516858
317
+ name: Cosine Recall@5
318
+ - type: cosine_recall@10
319
+ value: 0.9526248399487837
320
+ name: Cosine Recall@10
321
+ - type: cosine_ndcg@10
322
+ value: 0.8684852482950756
323
+ name: Cosine Ndcg@10
324
+ - type: cosine_mrr@10
325
+ value: 0.8410296797620739
326
+ name: Cosine Mrr@10
327
+ - type: cosine_map@100
328
+ value: 0.8431204567938398
329
+ name: Cosine Map@100
330
+ - type: dot_accuracy@1
331
+ value: 0.7763551002987623
332
+ name: Dot Accuracy@1
333
+ - type: dot_accuracy@3
334
+ value: 0.8941527955612463
335
+ name: Dot Accuracy@3
336
+ - type: dot_accuracy@5
337
+ value: 0.9253094323516858
338
+ name: Dot Accuracy@5
339
+ - type: dot_accuracy@10
340
+ value: 0.9526248399487837
341
+ name: Dot Accuracy@10
342
+ - type: dot_precision@1
343
+ value: 0.7763551002987623
344
+ name: Dot Precision@1
345
+ - type: dot_precision@3
346
+ value: 0.2980509318537487
347
+ name: Dot Precision@3
348
+ - type: dot_precision@5
349
+ value: 0.18506188647033714
350
+ name: Dot Precision@5
351
+ - type: dot_precision@10
352
+ value: 0.09526248399487836
353
+ name: Dot Precision@10
354
+ - type: dot_recall@1
355
+ value: 0.7763551002987623
356
+ name: Dot Recall@1
357
+ - type: dot_recall@3
358
+ value: 0.8941527955612463
359
+ name: Dot Recall@3
360
+ - type: dot_recall@5
361
+ value: 0.9253094323516858
362
+ name: Dot Recall@5
363
+ - type: dot_recall@10
364
+ value: 0.9526248399487837
365
+ name: Dot Recall@10
366
+ - type: dot_ndcg@10
367
+ value: 0.8684852482950756
368
+ name: Dot Ndcg@10
369
+ - type: dot_mrr@10
370
+ value: 0.8410296797620739
371
+ name: Dot Mrr@10
372
+ - type: dot_map@100
373
+ value: 0.8431204567938398
374
+ name: Dot Map@100
375
+ ---
376
+
377
+ # SentenceTransformer
378
+
379
+ This is a [sentence-transformers](https://www.SBERT.net) model trained. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
380
+
381
+ ## Model Details
382
+
383
+ ### Model Description
384
+ - **Model Type:** Sentence Transformer
385
+ <!-- - **Base model:** [Unknown](https://huggingface.co/unknown) -->
386
+ - **Maximum Sequence Length:** 512 tokens
387
+ - **Output Dimensionality:** 768 tokens
388
+ - **Similarity Function:** Cosine Similarity
389
+ <!-- - **Training Dataset:** Unknown -->
390
+ <!-- - **Language:** Unknown -->
391
+ <!-- - **License:** Unknown -->
392
+
393
+ ### Model Sources
394
+
395
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
396
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
397
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
398
+
399
+ ### Full Model Architecture
400
+
401
+ ```
402
+ SentenceTransformer(
403
+ (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
404
+ (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
405
+ (2): Normalize()
406
+ )
407
+ ```
408
+
409
+ ## Usage
410
+
411
+ ### Direct Usage (Sentence Transformers)
412
+
413
+ First install the Sentence Transformers library:
414
+
415
+ ```bash
416
+ pip install -U sentence-transformers
417
+ ```
418
+
419
+ Then you can load this model and run inference.
420
+ ```python
421
+ from sentence_transformers import SentenceTransformer
422
+
423
+ # Download from the 🤗 Hub
424
+ model = SentenceTransformer("sentence_transformers_model_id")
425
+ # Run inference
426
+ sentences = [
427
+ 'anKo će besplatno boraviti u vrtićima?',
428
+ 'Roditelji, njih 4127, zbog promene materijalnog statusa plaćaće najvišu cenu, a zbog nepotpune dokumentacije, naknadno će biti urađeno još 376 rešenja Kako je u celodnevni boravak do sada upisano 47800 mališana, 15800 roditelja nije ni podnelo zahteve, jer su pretpostavili da zbog visine mesečnih primanja ne bi ni mogli da ostvare neki od popusta – U vrtićima će besplatno boraviti 248 dece koja žive u socijalno ugroženim porodicama, čije su porodice korisnici materijalnog obezbeđenja porodice ili se nalaze u Sigurnoj kući',
429
+ 'Pored dobro poznatih isparljivih terpena, polifenolna jedinjenja Doktorska disertacija 22 rastvorna u vodi, kao što su derivati benzoeve i cimetne kiseline, mogu poslužiti kao alelopatske supstance. Polifenolna jedinjenja mogu biti i signalni molekuli u interakcijama biljke i bakterija koje fiksiraju azot kod mahunarki (Strack, 1997). Značajna uloga flavonoida i fenolnih kiselina je njihovo učešće u odbrambenom mehanizmu biljke. Dokazano je da se u uslovima stresa (prekomerno UV zračenje, oštećenje tkiva, infekcija) u biljkama indukuje sinteza polifenolnih jedinjenja (Britton, 1983; Dixon i Paiva, 1995). Polifenolna jedinjenja se mogu akumulirati pre i posle napada mikroorganizama. Pre infekcije su u formi toksina, dok su postinfekcijska polifenolna jedinjenja u fromi tzv. fitoaleksina.',
430
+ ]
431
+ embeddings = model.encode(sentences)
432
+ print(embeddings.shape)
433
+ # [3, 768]
434
+
435
+ # Get the similarity scores for the embeddings
436
+ similarities = model.similarity(embeddings, embeddings)
437
+ print(similarities.shape)
438
+ # [3, 3]
439
+ ```
440
+
441
+ <!--
442
+ ### Direct Usage (Transformers)
443
+
444
+ <details><summary>Click to see the direct usage in Transformers</summary>
445
+
446
+ </details>
447
+ -->
448
+
449
+ <!--
450
+ ### Downstream Usage (Sentence Transformers)
451
+
452
+ You can finetune this model on your own dataset.
453
+
454
+ <details><summary>Click to expand</summary>
455
+
456
+ </details>
457
+ -->
458
+
459
+ <!--
460
+ ### Out-of-Scope Use
461
+
462
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
463
+ -->
464
+
465
+ ## Evaluation
466
+
467
+ ### Metrics
468
+
469
+ #### Information Retrieval
470
+ * Dataset: `sts-dev`
471
+ * Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
472
+
473
+ | Metric | Value |
474
+ |:--------------------|:-----------|
475
+ | cosine_accuracy@1 | 0.7674 |
476
+ | cosine_accuracy@3 | 0.8835 |
477
+ | cosine_accuracy@5 | 0.9206 |
478
+ | cosine_accuracy@10 | 0.9492 |
479
+ | cosine_precision@1 | 0.7674 |
480
+ | cosine_precision@3 | 0.2945 |
481
+ | cosine_precision@5 | 0.1841 |
482
+ | cosine_precision@10 | 0.0949 |
483
+ | cosine_recall@1 | 0.7674 |
484
+ | cosine_recall@3 | 0.8835 |
485
+ | cosine_recall@5 | 0.9206 |
486
+ | cosine_recall@10 | 0.9492 |
487
+ | cosine_ndcg@10 | 0.8602 |
488
+ | cosine_mrr@10 | 0.8314 |
489
+ | **cosine_map@100** | **0.8334** |
490
+ | dot_accuracy@1 | 0.7674 |
491
+ | dot_accuracy@3 | 0.8835 |
492
+ | dot_accuracy@5 | 0.9206 |
493
+ | dot_accuracy@10 | 0.9492 |
494
+ | dot_precision@1 | 0.7674 |
495
+ | dot_precision@3 | 0.2945 |
496
+ | dot_precision@5 | 0.1841 |
497
+ | dot_precision@10 | 0.0949 |
498
+ | dot_recall@1 | 0.7674 |
499
+ | dot_recall@3 | 0.8835 |
500
+ | dot_recall@5 | 0.9206 |
501
+ | dot_recall@10 | 0.9492 |
502
+ | dot_ndcg@10 | 0.8602 |
503
+ | dot_mrr@10 | 0.8314 |
504
+ | dot_map@100 | 0.8334 |
505
+
506
+ #### Information Retrieval
507
+ * Dataset: `sts-dev`
508
+ * Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
509
+
510
+ | Metric | Value |
511
+ |:--------------------|:-----------|
512
+ | cosine_accuracy@1 | 0.7764 |
513
+ | cosine_accuracy@3 | 0.8942 |
514
+ | cosine_accuracy@5 | 0.9253 |
515
+ | cosine_accuracy@10 | 0.9526 |
516
+ | cosine_precision@1 | 0.7764 |
517
+ | cosine_precision@3 | 0.2981 |
518
+ | cosine_precision@5 | 0.1851 |
519
+ | cosine_precision@10 | 0.0953 |
520
+ | cosine_recall@1 | 0.7764 |
521
+ | cosine_recall@3 | 0.8942 |
522
+ | cosine_recall@5 | 0.9253 |
523
+ | cosine_recall@10 | 0.9526 |
524
+ | cosine_ndcg@10 | 0.8685 |
525
+ | cosine_mrr@10 | 0.841 |
526
+ | **cosine_map@100** | **0.8431** |
527
+ | dot_accuracy@1 | 0.7764 |
528
+ | dot_accuracy@3 | 0.8942 |
529
+ | dot_accuracy@5 | 0.9253 |
530
+ | dot_accuracy@10 | 0.9526 |
531
+ | dot_precision@1 | 0.7764 |
532
+ | dot_precision@3 | 0.2981 |
533
+ | dot_precision@5 | 0.1851 |
534
+ | dot_precision@10 | 0.0953 |
535
+ | dot_recall@1 | 0.7764 |
536
+ | dot_recall@3 | 0.8942 |
537
+ | dot_recall@5 | 0.9253 |
538
+ | dot_recall@10 | 0.9526 |
539
+ | dot_ndcg@10 | 0.8685 |
540
+ | dot_mrr@10 | 0.841 |
541
+ | dot_map@100 | 0.8431 |
542
+
543
+ <!--
544
+ ## Bias, Risks and Limitations
545
+
546
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
547
+ -->
548
+
549
+ <!--
550
+ ### Recommendations
551
+
552
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
553
+ -->
554
+
555
+ ## Training Details
556
+
557
+ ### Training Dataset
558
+
559
+ #### Unnamed Dataset
560
+
561
+
562
+ * Size: 9,371 training samples
563
+ * Columns: <code>anchor</code> and <code>positive</code>
564
+ * Approximate statistics based on the first 1000 samples:
565
+ | | anchor | positive |
566
+ |:--------|:----------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|
567
+ | type | string | string |
568
+ | details | <ul><li>min: 7 tokens</li><li>mean: 14.93 tokens</li><li>max: 31 tokens</li></ul> | <ul><li>min: 106 tokens</li><li>mean: 171.74 tokens</li><li>max: 375 tokens</li></ul> |
569
+ * Samples:
570
+ | anchor | positive |
571
+ |:------------------------------------------------------------|:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
572
+ | <code>anŠta su nosioci informacija u okruženju?</code> | <code>To sredstvo mogu biti sami akteri kao nosioci i prenosioci informacija ali može biti i okruženje Okruženje može biti zajedničko, neposredno, kada su akteri u istom prostoru, ali se informacija prenosi i među razdvojenim okruženjima, f zičkom vezom, putem kojim se kreću prenosioci informacija - akteri u kretanju kroz prostor, predmeti koje se prenose ili ono što smatramo čistom informacionom razmenom iako ima određeni f zički okvir: zvuk koji se prenosi kroz materiju, električni signal u telefonskim provodnicima, i nosioci elektromagnetnog zračenja u prostoru ili optičkim provodnicima</code> |
573
+ | <code>anKako se zasniva istraživački pristup?</code> | <code>Generalno posmatrano, istraživački pristup zasniva se na analitičkosintetičkom, odnosno deduktivno-induktivnom pristupu, gde se od opšteg teži saznanju o pojedinačnom, a potom se iz pojedinačnog, sintezom i generalizacijom, teži zaključivanju o opštem U prvoj fazi, primenjena 106 istraživanja slediće deduktivni model (top-down) krećući od ispitivanja: 1) osnovnih načela, principa i pristupa planiranja u RS, 2) analize ukupnog planskog procesa i njegovih faza i 3) analize strukture i sadržaja planova u okviru referentnih modela planiranja (Slika 26</code> |
574
+ | <code>anŠta je uticalo na loše rezultate poslovanja?</code> | <code>319 stabilno poslovanje Drugi stratum čini takođe šest velikih privrednih subjekata koji su u istom vremenskom okviru imali narušenu finansijsku strukturu, što se direktno odrazilo i na loše rezutate poslovanja Na bazi predloženih kompanija formirane su dve polarizovane grupe velikih privrednih subjekata kako bi putem predloženog modela mogla da se pokaže homogenost u kretanju kvantitativnih i kvalitativnih pokazatelja Takođe, polarizovani pristup u istraživanju dao je mogućnost dodatnog testiranja pouzdanosti predloženog modela ocene kreditnog boniteta velikih privrednih subjekata</code> |
575
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
576
+ ```json
577
+ {
578
+ "scale": 20.0,
579
+ "similarity_fct": "cos_sim"
580
+ }
581
+ ```
582
+
583
+ ### Evaluation Dataset
584
+
585
+ #### Unnamed Dataset
586
+
587
+
588
+ * Size: 2,343 evaluation samples
589
+ * Columns: <code>anchor</code> and <code>positive</code>
590
+ * Approximate statistics based on the first 1000 samples:
591
+ | | anchor | positive |
592
+ |:--------|:----------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|
593
+ | type | string | string |
594
+ | details | <ul><li>min: 8 tokens</li><li>mean: 14.77 tokens</li><li>max: 44 tokens</li></ul> | <ul><li>min: 113 tokens</li><li>mean: 177.33 tokens</li><li>max: 481 tokens</li></ul> |
595
+ * Samples:
596
+ | anchor | positive |
597
+ |:-----------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
598
+ | <code>anKo je iskoristio prokopavanje male prevlake kao povod za rat?</code> | <code> godine prokopavati malu prevlaku kojom je Cavtat spojen sa kopnom imajući u vidu da ga pretvore u tvrđavu kojom bi branili posjede u Konavlima Ovo je zasmetalo Radoslavu Pavloviću, pa je to i iskoristio kao povod za rat sa Dubrovačkom republikom, tvrdeći da on nije prodao Konavle već ih samo založio U ovom ratu Dubrovnik se obratio za pomoć od despota Đurađa Brankovića, kralja Stefana Tvrtka Drugog Kotromanića, sultana Murata Drugog, kralja Žigmunda Kao najbliži saveznici bili su im Sandalj Hranić i kralj Tvrtko</code> |
599
+ | <code>anKo je vodio Briž u XV veku?</code> | <code>Mnogo leševa ležalo je na šinama kad su spasitelji stigli. Sila eksplozija devastirala je vozove i odbacila delove leševa u vazduh. Ubrzo je za seriju koordiniranih napada od strane španskih vlasti optužena baskijska separatistička grupa ETA. Ta grupa odbacila je odgovornost, i sumnja je pala na islamske ekstremiste kad je policija pronašla jedan kombi sa detonatorima i stihovima iz Kurana u njemu. Kasnije, jedno pismo, navodno Al-Kaidino, došlo je arapskom listu Al-Kuds u Londonu preuzimajući odgovornost za masakr. Od XV veka u Brižu vladaju burgundske vojvode, koji su grad doveli do visokog nivoa u kulturi, arhitekturi i privredi. Briž je krajem Srednjeg veka bio najbogatiji grad severa Evrope.</code> |
600
+ | <code>anKo je učestvovao u hapšenju Slobodana Miloševića?</code> | <code> godine, JSO je učestvovala u hapšenju Slobodana Miloševića a tom prilikom je ćerka Slobodana Miloševića pucala, a metak je okrznuo Milorada Ulemeka Legiju Od 2001 godine jedinica je imala i istureno odeljenje u Vranju u hali fabrike Zavarivač Pobuna Jedinice za specijalne operacije MUP-a Srbije trajala je od 9 do 17 novembra 2001 godine kada je JSO otkazala poslušnost, blokirala bazu u Kuli i ispostavila zahteve za smenu ministra unutrašnjih poslova, načelnika Resora državne bezbednosti i njenog zamenika, a potom su uz upotrebu borbenih vozila i naoružanja blokirali auto-put kod Vrbasa a narednih dana i kod Beograda</code> |
601
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
602
+ ```json
603
+ {
604
+ "scale": 20.0,
605
+ "similarity_fct": "cos_sim"
606
+ }
607
+ ```
608
+
609
+ ### Training Hyperparameters
610
+ #### Non-Default Hyperparameters
611
+
612
+ - `eval_strategy`: steps
613
+ - `per_device_train_batch_size`: 16
614
+ - `per_device_eval_batch_size`: 16
615
+ - `learning_rate`: 2e-05
616
+ - `weight_decay`: 0.01
617
+ - `num_train_epochs`: 5
618
+ - `lr_scheduler_type`: constant_with_warmup
619
+ - `warmup_ratio`: 0.2
620
+ - `fp16`: True
621
+ - `load_best_model_at_end`: True
622
+ - `batch_sampler`: no_duplicates
623
+
624
+ #### All Hyperparameters
625
+ <details><summary>Click to expand</summary>
626
+
627
+ - `overwrite_output_dir`: False
628
+ - `do_predict`: False
629
+ - `eval_strategy`: steps
630
+ - `prediction_loss_only`: True
631
+ - `per_device_train_batch_size`: 16
632
+ - `per_device_eval_batch_size`: 16
633
+ - `per_gpu_train_batch_size`: None
634
+ - `per_gpu_eval_batch_size`: None
635
+ - `gradient_accumulation_steps`: 1
636
+ - `eval_accumulation_steps`: None
637
+ - `torch_empty_cache_steps`: None
638
+ - `learning_rate`: 2e-05
639
+ - `weight_decay`: 0.01
640
+ - `adam_beta1`: 0.9
641
+ - `adam_beta2`: 0.999
642
+ - `adam_epsilon`: 1e-08
643
+ - `max_grad_norm`: 1.0
644
+ - `num_train_epochs`: 5
645
+ - `max_steps`: -1
646
+ - `lr_scheduler_type`: constant_with_warmup
647
+ - `lr_scheduler_kwargs`: {}
648
+ - `warmup_ratio`: 0.2
649
+ - `warmup_steps`: 0
650
+ - `log_level`: passive
651
+ - `log_level_replica`: warning
652
+ - `log_on_each_node`: True
653
+ - `logging_nan_inf_filter`: True
654
+ - `save_safetensors`: True
655
+ - `save_on_each_node`: False
656
+ - `save_only_model`: False
657
+ - `restore_callback_states_from_checkpoint`: False
658
+ - `no_cuda`: False
659
+ - `use_cpu`: False
660
+ - `use_mps_device`: False
661
+ - `seed`: 42
662
+ - `data_seed`: None
663
+ - `jit_mode_eval`: False
664
+ - `use_ipex`: False
665
+ - `bf16`: False
666
+ - `fp16`: True
667
+ - `fp16_opt_level`: O1
668
+ - `half_precision_backend`: auto
669
+ - `bf16_full_eval`: False
670
+ - `fp16_full_eval`: False
671
+ - `tf32`: None
672
+ - `local_rank`: 0
673
+ - `ddp_backend`: None
674
+ - `tpu_num_cores`: None
675
+ - `tpu_metrics_debug`: False
676
+ - `debug`: []
677
+ - `dataloader_drop_last`: False
678
+ - `dataloader_num_workers`: 0
679
+ - `dataloader_prefetch_factor`: None
680
+ - `past_index`: -1
681
+ - `disable_tqdm`: False
682
+ - `remove_unused_columns`: True
683
+ - `label_names`: None
684
+ - `load_best_model_at_end`: True
685
+ - `ignore_data_skip`: False
686
+ - `fsdp`: []
687
+ - `fsdp_min_num_params`: 0
688
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
689
+ - `fsdp_transformer_layer_cls_to_wrap`: None
690
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
691
+ - `deepspeed`: None
692
+ - `label_smoothing_factor`: 0.0
693
+ - `optim`: adamw_torch
694
+ - `optim_args`: None
695
+ - `adafactor`: False
696
+ - `group_by_length`: False
697
+ - `length_column_name`: length
698
+ - `ddp_find_unused_parameters`: None
699
+ - `ddp_bucket_cap_mb`: None
700
+ - `ddp_broadcast_buffers`: False
701
+ - `dataloader_pin_memory`: True
702
+ - `dataloader_persistent_workers`: False
703
+ - `skip_memory_metrics`: True
704
+ - `use_legacy_prediction_loop`: False
705
+ - `push_to_hub`: False
706
+ - `resume_from_checkpoint`: None
707
+ - `hub_model_id`: None
708
+ - `hub_strategy`: every_save
709
+ - `hub_private_repo`: False
710
+ - `hub_always_push`: False
711
+ - `gradient_checkpointing`: False
712
+ - `gradient_checkpointing_kwargs`: None
713
+ - `include_inputs_for_metrics`: False
714
+ - `eval_do_concat_batches`: True
715
+ - `fp16_backend`: auto
716
+ - `push_to_hub_model_id`: None
717
+ - `push_to_hub_organization`: None
718
+ - `mp_parameters`:
719
+ - `auto_find_batch_size`: False
720
+ - `full_determinism`: False
721
+ - `torchdynamo`: None
722
+ - `ray_scope`: last
723
+ - `ddp_timeout`: 1800
724
+ - `torch_compile`: False
725
+ - `torch_compile_backend`: None
726
+ - `torch_compile_mode`: None
727
+ - `dispatch_batches`: None
728
+ - `split_batches`: None
729
+ - `include_tokens_per_second`: False
730
+ - `include_num_input_tokens_seen`: False
731
+ - `neftune_noise_alpha`: None
732
+ - `optim_target_modules`: None
733
+ - `batch_eval_metrics`: False
734
+ - `eval_on_start`: False
735
+ - `eval_use_gather_object`: False
736
+ - `batch_sampler`: no_duplicates
737
+ - `multi_dataset_batch_sampler`: proportional
738
+
739
+ </details>
740
+
741
+ ### Training Logs
742
+ | Epoch | Step | Training Loss | loss | sts-dev_cosine_map@100 |
743
+ |:----------:|:-------:|:-------------:|:----------:|:----------------------:|
744
+ | 0 | 0 | - | - | 0.7395 |
745
+ | 0.1706 | 100 | 0.7713 | 0.1087 | 0.7842 |
746
+ | 0.3413 | 200 | 0.118 | 0.0595 | 0.8358 |
747
+ | 0.5119 | 300 | 0.0654 | 0.0532 | 0.8388 |
748
+ | 0.6826 | 400 | 0.0682 | 0.0505 | 0.8461 |
749
+ | 0.8532 | 500 | 0.0634 | 0.0524 | 0.8432 |
750
+ | **1.0239** | **600** | **0.0748** | **0.0413** | **0.8431** |
751
+ | 1.1945 | 700 | 0.0573 | 0.0416 | 0.8389 |
752
+ | 1.3652 | 800 | 0.044 | 0.0454 | 0.8379 |
753
+ | 1.5358 | 900 | 0.0194 | 0.0427 | 0.8489 |
754
+ | 1.7065 | 1000 | 0.0176 | 0.0447 | 0.8431 |
755
+ | 1.8771 | 1100 | 0.0125 | 0.0438 | 0.8432 |
756
+ | 2.0478 | 1200 | 0.0113 | 0.0423 | 0.8413 |
757
+ | 2.2184 | 1300 | 0.0083 | 0.0418 | 0.8351 |
758
+ | 2.3891 | 1400 | 0.0095 | 0.0417 | 0.8373 |
759
+ | 2.5597 | 1500 | 0.0047 | 0.0415 | 0.8424 |
760
+ | 2.7304 | 1600 | 0.0053 | 0.0431 | 0.8434 |
761
+ | 2.9010 | 1700 | 0.0046 | 0.0458 | 0.8407 |
762
+ | 3.0717 | 1800 | 0.0031 | 0.0447 | 0.8326 |
763
+ | 3.2423 | 1900 | 0.0035 | 0.0439 | 0.8334 |
764
+ | 3.4130 | 2000 | 0.0024 | 0.0461 | 0.8296 |
765
+ | 3.5836 | 2100 | 0.0024 | 0.0435 | 0.8346 |
766
+ | 3.7543 | 2200 | 0.0018 | 0.0440 | 0.8340 |
767
+ | 3.9249 | 2300 | 0.0013 | 0.0448 | 0.8312 |
768
+ | 4.0956 | 2400 | 0.0012 | 0.0447 | 0.8350 |
769
+ | 4.2662 | 2500 | 0.0013 | 0.0424 | 0.8297 |
770
+ | 4.4369 | 2600 | 0.0009 | 0.0420 | 0.8317 |
771
+ | 4.6075 | 2700 | 0.0008 | 0.0427 | 0.8375 |
772
+ | 4.7782 | 2800 | 0.0008 | 0.0434 | 0.8379 |
773
+ | 4.9488 | 2900 | 0.0007 | 0.0451 | 0.8334 |
774
+ | 5.0 | 2930 | - | - | 0.8431 |
775
+
776
+ * The bold row denotes the saved checkpoint.
777
+
778
+ ### Framework Versions
779
+ - Python: 3.10.8
780
+ - Sentence Transformers: 3.0.1
781
+ - Transformers: 4.44.2
782
+ - PyTorch: 2.4.0+cu121
783
+ - Accelerate: 0.30.0
784
+ - Datasets: 2.21.0
785
+ - Tokenizers: 0.19.1
786
+
787
+ ## Citation
788
+
789
+ ### BibTeX
790
+
791
+ #### Sentence Transformers
792
+ ```bibtex
793
+ @inproceedings{reimers-2019-sentence-bert,
794
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
795
+ author = "Reimers, Nils and Gurevych, Iryna",
796
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
797
+ month = "11",
798
+ year = "2019",
799
+ publisher = "Association for Computational Linguistics",
800
+ url = "https://arxiv.org/abs/1908.10084",
801
+ }
802
+ ```
803
+
804
+ #### MultipleNegativesRankingLoss
805
+ ```bibtex
806
+ @misc{henderson2017efficient,
807
+ title={Efficient Natural Language Response Suggestion for Smart Reply},
808
+ author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
809
+ year={2017},
810
+ eprint={1705.00652},
811
+ archivePrefix={arXiv},
812
+ primaryClass={cs.CL}
813
+ }
814
+ ```
815
+
816
+ <!--
817
+ ## Glossary
818
+
819
+ *Clearly define terms in order to be accessible across audiences.*
820
+ -->
821
+
822
+ <!--
823
+ ## Model Card Authors
824
+
825
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
826
+ -->
827
+
828
+ <!--
829
+ ## Model Card Contact
830
+
831
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
832
+ -->
config.json ADDED
@@ -0,0 +1,28 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "output/make_multilingual_en_sr_2024_09_27_10_55_23/final_model",
3
+ "architectures": [
4
+ "XLMRobertaModel"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "bos_token_id": 0,
8
+ "classifier_dropout": null,
9
+ "eos_token_id": 2,
10
+ "hidden_act": "gelu",
11
+ "hidden_dropout_prob": 0.1,
12
+ "hidden_size": 768,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 3072,
15
+ "layer_norm_eps": 1e-05,
16
+ "max_position_embeddings": 514,
17
+ "model_type": "xlm-roberta",
18
+ "num_attention_heads": 12,
19
+ "num_hidden_layers": 12,
20
+ "output_past": true,
21
+ "pad_token_id": 1,
22
+ "position_embedding_type": "absolute",
23
+ "torch_dtype": "float32",
24
+ "transformers_version": "4.44.2",
25
+ "type_vocab_size": 1,
26
+ "use_cache": true,
27
+ "vocab_size": 250002
28
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.0.1",
4
+ "transformers": "4.44.2",
5
+ "pytorch": "2.4.0+cu121"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": null
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:2aff3fe3b4389d077a942d51d1f38f94a263376c0cfa95a67a649a2052ebbf76
3
+ size 1112197096
modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 512,
3
+ "do_lower_case": false
4
+ }
sentencepiece.bpe.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
3
+ size 5069051
special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:883b037111086fd4dfebbbc9b7cee11e1517b5e0c0514879478661440f137085
3
+ size 17082987
tokenizer_config.json ADDED
@@ -0,0 +1,61 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "250001": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": true,
46
+ "cls_token": "<s>",
47
+ "eos_token": "</s>",
48
+ "mask_token": "<mask>",
49
+ "max_length": 512,
50
+ "model_max_length": 512,
51
+ "pad_to_multiple_of": null,
52
+ "pad_token": "<pad>",
53
+ "pad_token_type_id": 0,
54
+ "padding_side": "right",
55
+ "sep_token": "</s>",
56
+ "stride": 0,
57
+ "tokenizer_class": "XLMRobertaTokenizer",
58
+ "truncation_side": "right",
59
+ "truncation_strategy": "longest_first",
60
+ "unk_token": "<unk>"
61
+ }