Noureddinesa commited on
Commit
a426f06
·
verified ·
1 Parent(s): 05f7bdb

Add new SentenceTransformer model

Browse files
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 768,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,724 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - sentence-similarity
5
+ - feature-extraction
6
+ - generated_from_trainer
7
+ - dataset_size:387
8
+ - loss:MultipleNegativesRankingLoss
9
+ base_model: nomic-ai/nomic-embed-text-v1.5
10
+ widget:
11
+ - source_sentence: L'achat concerne l'acquisition de services de transport pour faciliter
12
+ la mobilité des équipes lors d'opérations commerciales.
13
+ sentences:
14
+ - 'Les achats non stockés de matières et de fournitures concernent les biens et
15
+ services que l''entreprise utilise directement sans les conserver en stock, comme
16
+ l''eau, l''électricité et d''autres fournitures jugées non nécessaires à stocker.
17
+
18
+
19
+ 1. Achat d''eau pour les besoins d''une cantine d''entreprise. 2. Facture d''électricité
20
+ pour le fonctionnement des bureaux. 3. Achat de papier et fournitures de bureau
21
+ pour des projets ponctuels. 4. Achat de services de nettoyage pour les locaux
22
+ de l''entreprise. 5. Paiement d''un abonnement à un service de cloud pour le stockage
23
+ de données. 6. Achat de carburant pour les véhicules de l''entreprise. 7. Coût
24
+ des services de télécommunication pour les employés. 8. Achat de petits outils
25
+ utilisés lors de réparations, sans gestion de stock. 9. Frais d''entretien d''équipements
26
+ sans pièces de rechange stockées. 10. Achat de matériel de sécurité pour un événement
27
+ spécifique. 11. Coût de la publicité sur les réseaux sociaux. 12. Paiement pour
28
+ des services de conseil ponctuels. 13. Achat de billets de transport pour des
29
+ déplacements professionnels. 14. Dépenses pour des formations professionnelles
30
+ non prévues à long terme. 15. Achat de supports de communication pour un événement
31
+ temporaire.'
32
+ - 'Les achats non stockés de matières et de fournitures concernent les biens et
33
+ services que l''entreprise utilise directement sans les conserver en stock, comme
34
+ l''eau, l''électricité et d''autres fournitures jugées non nécessaires à stocker.
35
+
36
+
37
+ 1. Achat d''eau pour les besoins d''une cantine d''entreprise. 2. Facture d''électricité
38
+ pour le fonctionnement des bureaux. 3. Achat de papier et fournitures de bureau
39
+ pour des projets ponctuels. 4. Achat de services de nettoyage pour les locaux
40
+ de l''entreprise. 5. Paiement d''un abonnement à un service de cloud pour le stockage
41
+ de données. 6. Achat de carburant pour les véhicules de l''entreprise. 7. Coût
42
+ des services de télécommunication pour les employés. 8. Achat de petits outils
43
+ utilisés lors de réparations, sans gestion de stock. 9. Frais d''entretien d''équipements
44
+ sans pièces de rechange stockées. 10. Achat de matériel de sécurité pour un événement
45
+ spécifique. 11. Coût de la publicité sur les réseaux sociaux. 12. Paiement pour
46
+ des services de conseil ponctuels. 13. Achat de billets de transport pour des
47
+ déplacements professionnels. 14. Dépenses pour des formations professionnelles
48
+ non prévues à long terme. 15. Achat de supports de communication pour un événement
49
+ temporaire.'
50
+ - 'Les charges sociales diverses désignent les coûts engagés par une entreprise
51
+ pour le bien-être et la protection de ses employés. Cela inclut les cotisations
52
+ à des assurances, les prestations de retraite, le financement d''œuvres sociales,
53
+ la fourniture de vêtements de travail, et d''autres indemnisations et services
54
+ liés à la santé et aux conditions de travail des salariés.
55
+
56
+
57
+ 1. Cotisations pour une assurance santé collective des employés.
58
+
59
+ 2. Versements pour la retraite complémentaire des anciens salariés.
60
+
61
+ 3. Financement des activités du comité d''entreprise, comme des événements sociaux.
62
+
63
+ 4. Distribution de vêtements de travail pour les employés de l''usine.
64
+
65
+ 5. Indemnités versées lors d''un licenciement sans préavis.
66
+
67
+ 6. Cotisations pour des services de santé au travail pour surveiller la santé
68
+ des employés.
69
+
70
+ 7. Achats de médicaments pour la trousse de premiers secours de l''entreprise.
71
+
72
+ 8. Paiement de subventions pour la crèche accueillant les enfants des employés.
73
+
74
+ 9. Organisation de colonies de vacances pour les enfants des salariés.
75
+
76
+ 10. Frais liés à des formations professionnelles proposées aux employés.
77
+
78
+ 11. Contributions pour des cantines d''entreprise offrant des repas aux salariés.
79
+
80
+ 12. Couverture des frais médicaux en cas d''accident du travail.
81
+
82
+ 13. Aide financière pour les employés en difficulté financière.
83
+
84
+ 14. Soutien aux activités sportives ou culturelles organisées pour les employés.
85
+
86
+ 15. Participation aux frais de transport pour faciliter le trajet domicile-travail.'
87
+ - source_sentence: La dépense est pour l'achat de billets de transport pour permettre
88
+ aux employés de se rendre à un événement professionnel.
89
+ sentences:
90
+ - 'Les achats non stockés de matières et de fournitures concernent les biens et
91
+ services que l''entreprise utilise directement sans les conserver en stock, comme
92
+ l''eau, l''électricité et d''autres fournitures jugées non nécessaires à stocker.
93
+
94
+
95
+ 1. Achat d''eau pour les besoins d''une cantine d''entreprise. 2. Facture d''électricité
96
+ pour le fonctionnement des bureaux. 3. Achat de papier et fournitures de bureau
97
+ pour des projets ponctuels. 4. Achat de services de nettoyage pour les locaux
98
+ de l''entreprise. 5. Paiement d''un abonnement à un service de cloud pour le stockage
99
+ de données. 6. Achat de carburant pour les véhicules de l''entreprise. 7. Coût
100
+ des services de télécommunication pour les employés. 8. Achat de petits outils
101
+ utilisés lors de réparations, sans gestion de stock. 9. Frais d''entretien d''équipements
102
+ sans pièces de rechange stockées. 10. Achat de matériel de sécurité pour un événement
103
+ spécifique. 11. Coût de la publicité sur les réseaux sociaux. 12. Paiement pour
104
+ des services de conseil ponctuels. 13. Achat de billets de transport pour des
105
+ déplacements professionnels. 14. Dépenses pour des formations professionnelles
106
+ non prévues à long terme. 15. Achat de supports de communication pour un événement
107
+ temporaire.'
108
+ - 'Les installations techniques sont des ensembles de biens, matériels et constructions,
109
+ qui fonctionnent ensemble. La séparation de l''un d''eux compromet l''utilité
110
+ des autres. Par exemple, une salle de serveurs est une installation technique
111
+ si elle est spécialement conçue pour accueillir des équipements informatiques,
112
+ et retirer ces équipements rend la salle inutile.
113
+
114
+
115
+ 1. Une salle de serveurs dédiée à des ordinateurs.
116
+
117
+ 2. Un système de climatisation installé pour maintenir la température dans une
118
+ usine.
119
+
120
+ 3. Un ascenseur conçu uniquement pour desservir un bâtiment commercial.
121
+
122
+ 4. Un réseau de plomberie dans un immeuble résidentiel.
123
+
124
+ 5. Un système électrique spécifique à une chaîne de production.
125
+
126
+ 6. Un laboratoire équipé de matériels scientifiques spécialisés.
127
+
128
+ 7. Une cuisine professionnelle intégrée dans un restaurant.
129
+
130
+ 8. Un parc de stationnement construit uniquement pour les véhicules d''une entreprise.
131
+
132
+ 9. Un système de sécurité installé pour protéger un site industriel.
133
+
134
+ 10. Une ligne de production automatisée dans une usine.
135
+
136
+ 11. Un réservoir de stockage de produits chimiques dans une usine.
137
+
138
+ 12. Une salle de conférence équipée de matériel audiovisuel.
139
+
140
+ 13. Un entrepôt conçu pour stocker des marchandises avec des étagères fixes.
141
+
142
+ 14. Un équipement de filtration dans une station d''épuration.
143
+
144
+ 15. Une centrale électrique dédiée à alimenter un quartier en énergie.'
145
+ - 'La rémunération de l''exploitant correspond à la compensation financière versée
146
+ à une personne qui gère une entreprise individuelle. Cela inclut également les
147
+ contributions qu''il effectue pour sa propre sécurité sociale et retraite.
148
+
149
+
150
+ 1. Un artisan reçoit un paiement pour son travail en tant qu''exploitant d''un
151
+ atelier. 2. Un agriculteur perçoit un salaire pour la gestion de sa ferme. 3.
152
+ Un consultant facture ses services et se verse une rémunération. 4. Un propriétaire
153
+ de restaurant reçoit une rémunération pour sa gestion quotidienne. 5. Un commerçant
154
+ se verse un salaire mensuel pour son travail dans sa boutique. 6. Un freelance
155
+ s''établit un revenu à partir de ses contrats. 7. Un chauffeur de taxi exploitant
156
+ son propre véhicule se verse un salaire. 8. Un écrivain indépendant reçoit des
157
+ paiements pour ses publications et se rémunère. 9. Un coach sportif s''auto-rémunère
158
+ pour ses sessions de coaching. 10. Un graphiste indépendant facture ses clients
159
+ et se verse une partie de ses gains. 11. Un photographe professionnel vend des
160
+ services et s''établit un salaire. 12. Un propriétaire de société de nettoyage
161
+ se verse une rémunération pour son travail. 13. Un technicien de maintenance indépendant
162
+ reçoit un paiement et se rémunère. 14. Un musicien gérant sa propre carrière se
163
+ verse des honoraires après ses concerts. 15. Un web entrepreneur se fixe un salaire
164
+ à partir des bénéfices générés par son site.'
165
+ - source_sentence: L'achat concerne des emballages en plastique pour protéger des
166
+ produits fragiles lors de leur transport dans l'industrie.
167
+ sentences:
168
+ - 'Les achats d''emballages concernent l''acquisition de matériaux utilisés pour
169
+ conditionner des produits, incluant les emballages perdus, récupérables et à usage
170
+ mixte.
171
+
172
+
173
+ 1. Achat de cartons pour expédier des marchandises. 2. Acquisition de bouteilles
174
+ en plastique pour une boisson. 3. Commande de tonneaux en métal pour le stockage.
175
+ 4. Récupération de caisses en bois d''un fournisseur. 5. Achat de sacs en papier
176
+ pour des produits alimentaires. 6. Commande d''emballages en polystyrène pour
177
+ protéger des objets fragiles. 7. Utilisation de bouteilles en verre pour des jus
178
+ de fruits. 8. Acquisition d''emballages biodégradables pour des produits cosmétiques.
179
+ 9. Achat de film plastique pour envelopper des palettes. 10. Commande de boîtes
180
+ en métal pour des conserves. 11. Récupération d''emballages à usage mixte pour
181
+ un événement. 12. Achat de barquettes en plastique pour des plats à emporter.
182
+ 13. Commande de pots en verre pour des confitures. 14. Utilisation de caisses
183
+ en carton pour le transport de vêtements. 15. Achat de sachets en plastique pour
184
+ des produits en vrac.'
185
+ - 'Le matériel de bureau désigne l''ensemble des équipements utilisés dans un bureau
186
+ pour faciliter le travail administratif et organisationnel.
187
+
188
+
189
+ 1. Une photocopieuse utilisée pour reproduire des documents. 2. Un ordinateur
190
+ personnel pour gérer des fichiers et communiquer par email. 3. Une machine à écrire
191
+ pour rédiger des lettres. 4. Un scanner pour numériser des documents. 5. Des chaises
192
+ ergonomiques pour le confort des employés. 6. Un bureau pour travailler. 7. Des
193
+ fournitures de papeterie comme des stylos et des blocs-notes. 8. Un projecteur
194
+ pour faire des présentations. 9. Un tableau blanc pour brainstormer des idées.
195
+ 10. Un fax pour envoyer des documents rapidement. 11. Des classeurs pour organiser
196
+ les papiers. 12. Un téléphone pour la communication interne et externe. 13. Une
197
+ imprimante pour produire des copies physiques de documents. 14. Un agenda pour
198
+ planifier des réunions et des tâches. 15. Des câbles et accessoires pour connecter
199
+ les appareils électroniques.'
200
+ - 'Les autres charges à répartir sont des frais significatifs qui ne peuvent pas
201
+ être entièrement couverts dans une seule période comptable et doivent donc être
202
+ étalés sur plusieurs exercices. Cela inclut, par exemple, les coûts liés à des
203
+ projets de recherche ou d''autres investissements à long terme.
204
+
205
+
206
+ 1. Coûts de lancement d''un produit étalés sur plusieurs années. 2. Frais de formation
207
+ des employés répartis sur plusieurs exercices. 3. Dépenses de publicité pour une
208
+ campagne qui dure plusieurs mois ou années. 4. Coûts de rénovation d''un bâtiment
209
+ amortis sur plusieurs années. 5. Investissements en technologie étalés sur la
210
+ durée de vie de l''équipement. 6. Charges liées à un contrat de service de plusieurs
211
+ années. 7. Dépenses pour un événement annuel réparties sur plusieurs exercices.
212
+ 8. Coûts de développement d''un logiciel amortis sur sa durée d''utilisation.
213
+ 9. Frais juridiques pour un procès étalés sur les années de litige. 10. Dépenses
214
+ d''acquisition d''une licence réparties sur sa durée de validité. 11. Coûts liés
215
+ à un projet de construction amortis sur la durée de vie du bâtiment. 12. Dépenses
216
+ de recherche scientifique étalées sur plusieurs années de recherche. 13. Frais
217
+ d''adhésion à des associations professionnelles répartis sur la durée de l''adhésion.
218
+ 14. Coûts de marketing pour un nouveau produit répartis sur plusieurs mois. 15.
219
+ Dépenses de mise à niveau d''équipement réparties sur plusieurs exercices.'
220
+ - source_sentence: Des frais ont été engagés pour une stratégie de contenu axée sur
221
+ la production de podcasts diffusés sur plusieurs plateformes.
222
+ sentences:
223
+ - 'Les rabais, remises et ristournes sont des réductions accordées sur le prix d''achat
224
+ de marchandises, permettant d''économiser de l''argent lors de l''achat.
225
+
226
+
227
+ 1. Un magasin offre un rabais de 20% sur une paire de chaussures à 100€, donc
228
+ le client paie 80€. 2. Lors d''une promotion, un livre coûtant 15€ bénéficie d''une
229
+ remise de 3€, le client le paie 12€. 3. Un fournisseur accorde une ristourne de
230
+ 5% sur une commande de 1 000€, ce qui réduit le coût à 950€. 4. Un supermarché
231
+ applique une remise de 10% sur un panier de courses de 50€, le total s''élève
232
+ à 45€. 5. Un client fidèle reçoit un rabais de 10€ sur son prochain achat après
233
+ avoir dépensé 100€ dans une boutique. 6. Une entreprise achète des fournitures
234
+ de bureau et reçoit un rabais de 15% pour une commande supérieure à 200€. 7. Un
235
+ client achète une télévision à 800€ avec une remise de 100€, le prix final est
236
+ de 700€. 8. En fin de saison, un magasin de vêtements propose des remises allant
237
+ jusqu''à 50% sur les articles non vendus. 9. Un restaurant offre une remise de
238
+ 20% sur le total de l''addition pour les groupes de plus de 10 personnes. 10.
239
+ Lors d''un salon, une entreprise accorde un rabais de 30% sur ses produits aux
240
+ clients qui s''inscrivent à sa newsletter. 11. Une boutique en ligne propose une
241
+ ristourne de 5€ sur une commande de 50€ ou plus. 12. Un grossiste offre une remise
242
+ de 10% aux clients qui paient comptant. 13. Un distributeur accorde un rabais
243
+ de 15% sur les produits en promotion pour attirer plus de clients. 14. Pendant
244
+ les soldes, un article à 200€ peut bénéficier d''une réduction de 40%, le vendant
245
+ à 160€. 15. Un club de loisirs offre une remise de 25% pour les nouveaux membres
246
+ sur leur première inscription.'
247
+ - 'Les primes d''assurances sont des paiements effectués pour obtenir une couverture
248
+ financière contre divers risques, tels que le vol ou l''incendie, ainsi que pour
249
+ protéger les biens et les personnes liés à une entreprise.
250
+
251
+
252
+ 1. Une entreprise paie une prime d''assurance pour protéger ses locaux contre
253
+ les incendies. 2. Un commerçant souscrit une assurance pour couvrir le vol de
254
+ ses marchandises. 3. Une société paie des primes pour assurer ses employés contre
255
+ les accidents de travail. 4. Un constructeur d''appartements prend une assurance
256
+ contre les dommages causés à des tiers lors des travaux. 5. Une entreprise de
257
+ transport paye une prime pour assurer ses camions contre les accidents. 6. Un
258
+ restaurant souscrit une assurance responsabilité civile pour couvrir d''éventuels
259
+ accidents survenus à ses clients. 7. Une boutique de vêtements paie une prime
260
+ d''assurance pour protéger son stock contre les inondations. 8. Un cabinet médical
261
+ s''assure contre les risques de poursuites légales. 9. Une entreprise de construction
262
+ paie une prime d''assurance pour couvrir les dommages causés à son matériel. 10.
263
+ Une société de location de voitures souscrit une assurance pour couvrir les dommages
264
+ causés aux véhicules par les clients. 11. Un propriétaire d''immeuble paie une
265
+ prime pour assurer son bien contre les catastrophes naturelles. 12. Une société
266
+ d''événementiel prend une assurance pour se protéger contre les annulations d''événements.
267
+ 13. Un agriculteur souscrit une assurance contre les pertes de récolte dues aux
268
+ intempéries. 14. Une entreprise de nettoyage paie des primes pour couvrir les
269
+ dommages potentiels causés aux locaux de ses clients. 15. Un studio de photographie
270
+ s''assure contre la perte ou les dommages de son équipement.'
271
+ - 'Les frais de publicité sont des dépenses engagées pour promouvoir un produit
272
+ ou un service, souvent réparties sur plusieurs années, comme les frais de participation
273
+ à des foires ou l''impression de grandes quantités de catalogues.
274
+
275
+
276
+ 1. Participer à un salon professionnel pour présenter une nouvelle gamme de produits.
277
+ 2. Imprimer 10 000 brochures pour une campagne marketing. 3. Louer un espace publicitaire
278
+ dans un magazine pendant plusieurs mois. 4. Développer une campagne publicitaire
279
+ à la télévision sur plusieurs semaines. 5. Créer et diffuser une série de publicités
280
+ sur les réseaux sociaux pendant un an. 6. Concevoir un site web pour promouvoir
281
+ un événement sur plusieurs années. 7. Organiser un événement de lancement avec
282
+ des frais répartis sur plusieurs mois. 8. Distribuer des échantillons gratuits
283
+ dans les supermarchés sur une période prolongée. 9. Produire des vidéos promotionnelles
284
+ qui seront utilisées pendant plusieurs saisons. 10. Acheter des panneaux d''affichage
285
+ pour une campagne de longue durée. 11. S''engager dans un partenariat de co-marketing
286
+ sur plusieurs années. 12. Imprimer des affiches publicitaires pour plusieurs événements
287
+ au cours de l''année. 13. Sponsoriser une équipe sportive avec des frais étalés
288
+ sur plusieurs saisons. 14. Récupérer les coûts de publicité d''une campagne de
289
+ référencement payant sur plusieurs mois. 15. Concevoir une stratégie de contenu
290
+ sur un blog qui s''étend sur une année.'
291
+ - source_sentence: L'entreprise a acheté des tables de réunion pour créer un espace
292
+ collaboratif dans un open space.
293
+ sentences:
294
+ - 'Le matériel et outillage désignent les machines et outils utilisés dans l''industrie
295
+ pour extraire, transformer et conditionner des matières premières. Ils permettent
296
+ d''effectuer des tâches spécifiques et d''améliorer l''efficacité des opérations.
297
+
298
+
299
+ 1. Une presse hydraulique utilisée pour façonner des métaux. 2. Des scies à chaîne
300
+ pour couper du bois dans une scierie. 3. Des machines à coudre dans une usine
301
+ de textile. 4. Un four industriel pour cuire des produits alimentaires. 5. Des
302
+ chariots élévateurs pour déplacer des palettes en entrepôt. 6. Un compresseur
303
+ d''air utilisé pour alimenter des outils pneumatiques. 7. Une ligne de production
304
+ automatisée pour assembler des appareils électroniques. 8. Des équipements de
305
+ laboratoire pour analyser des échantillons. 9. Des outils de jardinage comme des
306
+ tondeuses et des débroussailleuses. 10. Un scanner 3D utilisé dans la fabrication
307
+ additive. 11. Des machines à imprimer dans une imprimerie. 12. Un broyeur pour
308
+ réduire la taille des matières premières. 13. Des équipements de conditionnement
309
+ pour emballer des produits. 14. Un pont roulant pour soulever des charges lourdes
310
+ dans une usine. 15. Des outils manuels comme des tournevis et des clés à molette
311
+ utilisés par des techniciens.'
312
+ - 'Les autres frais préliminaires sont des dépenses nécessaires pour établir ou
313
+ développer une entreprise, engagées lors de sa création ou par la suite.
314
+
315
+
316
+ 1. Frais de notaire pour la création de l''entreprise. 2. Coût des études de marché
317
+ avant le lancement d''un produit. 3. Honoraires d''un consultant pour un plan
318
+ d''affaires. 4. Dépenses liées à la recherche de locaux commerciaux. 5. Frais
319
+ pour l''enregistrement d''une marque. 6. Coût de la publicité avant l''ouverture
320
+ d''un magasin. 7. Dépenses pour des formations initiales des employés. 8. Frais
321
+ de création de site internet. 9. Coût des licences nécessaires pour exercer une
322
+ activité. 10. Dépenses pour l''achat de matériel de bureau avant le démarrage.
323
+ 11. Frais de rédaction des statuts juridiques de l''entreprise. 12. Dépenses de
324
+ voyage pour rencontrer des partenaires commerciaux potentiels. 13. Coût des services
325
+ d''un comptable pour préparer les documents fiscaux. 14. Frais de participation
326
+ à des salons professionnels pour se faire connaître. 15. Coût de l''assurance
327
+ entreprise pour démarrer en toute sécurité.'
328
+ - 'Le mobilier de bureau désigne l''ensemble des meubles utilisés dans un espace
329
+ de travail, tels que les bureaux, chaises, tables et rangements, qui contribuent
330
+ à l''organisation et au confort des employés.
331
+
332
+
333
+ 1. Un bureau en bois massif dans un cabinet d''architecte. 2. Des chaises ergonomiques
334
+ dans une salle de réunion. 3. Un espace de travail avec des tables modulables
335
+ dans une start-up. 4. Des étagères pour ranger des dossiers dans un bureau administratif.
336
+ 5. Un comptoir d''accueil dans une entreprise. 6. Des fauteuils confortables dans
337
+ une salle d''attente. 7. Un bureau debout pour favoriser une meilleure posture.
338
+ 8. Des meubles de rangement pour les fournitures de bureau. 9. Une table de conférence
339
+ pour les réunions d''équipe. 10. Un bureau partagé dans un espace de coworking.
340
+ 11. Des casiers pour les effets personnels des employés. 12. Un meuble TV dans
341
+ une salle de pause. 13. Des panneaux de séparation pour créer des espaces privés.
342
+ 14. Des meubles de rangement pour l''équipement informatique. 15. Une table ronde
343
+ pour favoriser la collaboration.'
344
+ datasets:
345
+ - Noureddinesa/Invoices_embedding_2
346
+ pipeline_tag: sentence-similarity
347
+ library_name: sentence-transformers
348
+ metrics:
349
+ - cosine_accuracy
350
+ model-index:
351
+ - name: SentenceTransformer based on nomic-ai/nomic-embed-text-v1.5
352
+ results:
353
+ - task:
354
+ type: triplet
355
+ name: Triplet
356
+ dataset:
357
+ name: all nli test
358
+ type: all-nli-test
359
+ metrics:
360
+ - type: cosine_accuracy
361
+ value: 1.0
362
+ name: Cosine Accuracy
363
+ ---
364
+
365
+ # SentenceTransformer based on nomic-ai/nomic-embed-text-v1.5
366
+
367
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [nomic-ai/nomic-embed-text-v1.5](https://huggingface.co/nomic-ai/nomic-embed-text-v1.5) on the [invoices_embedding_2](https://huggingface.co/datasets/Noureddinesa/Invoices_embedding_2) dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
368
+
369
+ ## Model Details
370
+
371
+ ### Model Description
372
+ - **Model Type:** Sentence Transformer
373
+ - **Base model:** [nomic-ai/nomic-embed-text-v1.5](https://huggingface.co/nomic-ai/nomic-embed-text-v1.5) <!-- at revision d802ae16c9caed4d197895d27c6d529434cd8c6d -->
374
+ - **Maximum Sequence Length:** 8192 tokens
375
+ - **Output Dimensionality:** 768 dimensions
376
+ - **Similarity Function:** Cosine Similarity
377
+ - **Training Dataset:**
378
+ - [invoices_embedding_2](https://huggingface.co/datasets/Noureddinesa/Invoices_embedding_2)
379
+ <!-- - **Language:** Unknown -->
380
+ <!-- - **License:** Unknown -->
381
+
382
+ ### Model Sources
383
+
384
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
385
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
386
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
387
+
388
+ ### Full Model Architecture
389
+
390
+ ```
391
+ SentenceTransformer(
392
+ (0): Transformer({'max_seq_length': 8192, 'do_lower_case': False}) with Transformer model: NomicBertModel
393
+ (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
394
+ )
395
+ ```
396
+
397
+ ## Usage
398
+
399
+ ### Direct Usage (Sentence Transformers)
400
+
401
+ First install the Sentence Transformers library:
402
+
403
+ ```bash
404
+ pip install -U sentence-transformers
405
+ ```
406
+
407
+ Then you can load this model and run inference.
408
+ ```python
409
+ from sentence_transformers import SentenceTransformer
410
+
411
+ # Download from the 🤗 Hub
412
+ model = SentenceTransformer("Noureddinesa/Invoices_NomicV1.5_1")
413
+ # Run inference
414
+ sentences = [
415
+ "L'entreprise a acheté des tables de réunion pour créer un espace collaboratif dans un open space.",
416
+ "Le mobilier de bureau désigne l'ensemble des meubles utilisés dans un espace de travail, tels que les bureaux, chaises, tables et rangements, qui contribuent à l'organisation et au confort des employés.\n\n1. Un bureau en bois massif dans un cabinet d'architecte. 2. Des chaises ergonomiques dans une salle de réunion. 3. Un espace de travail avec des tables modulables dans une start-up. 4. Des étagères pour ranger des dossiers dans un bureau administratif. 5. Un comptoir d'accueil dans une entreprise. 6. Des fauteuils confortables dans une salle d'attente. 7. Un bureau debout pour favoriser une meilleure posture. 8. Des meubles de rangement pour les fournitures de bureau. 9. Une table de conférence pour les réunions d'équipe. 10. Un bureau partagé dans un espace de coworking. 11. Des casiers pour les effets personnels des employés. 12. Un meuble TV dans une salle de pause. 13. Des panneaux de séparation pour créer des espaces privés. 14. Des meubles de rangement pour l'équipement informatique. 15. Une table ronde pour favoriser la collaboration.",
417
+ "Les autres frais préliminaires sont des dépenses nécessaires pour établir ou développer une entreprise, engagées lors de sa création ou par la suite.\n\n1. Frais de notaire pour la création de l'entreprise. 2. Coût des études de marché avant le lancement d'un produit. 3. Honoraires d'un consultant pour un plan d'affaires. 4. Dépenses liées à la recherche de locaux commerciaux. 5. Frais pour l'enregistrement d'une marque. 6. Coût de la publicité avant l'ouverture d'un magasin. 7. Dépenses pour des formations initiales des employés. 8. Frais de création de site internet. 9. Coût des licences nécessaires pour exercer une activité. 10. Dépenses pour l'achat de matériel de bureau avant le démarrage. 11. Frais de rédaction des statuts juridiques de l'entreprise. 12. Dépenses de voyage pour rencontrer des partenaires commerciaux potentiels. 13. Coût des services d'un comptable pour préparer les documents fiscaux. 14. Frais de participation à des salons professionnels pour se faire connaître. 15. Coût de l'assurance entreprise pour démarrer en toute sécurité.",
418
+ ]
419
+ embeddings = model.encode(sentences)
420
+ print(embeddings.shape)
421
+ # [3, 768]
422
+
423
+ # Get the similarity scores for the embeddings
424
+ similarities = model.similarity(embeddings, embeddings)
425
+ print(similarities.shape)
426
+ # [3, 3]
427
+ ```
428
+
429
+ <!--
430
+ ### Direct Usage (Transformers)
431
+
432
+ <details><summary>Click to see the direct usage in Transformers</summary>
433
+
434
+ </details>
435
+ -->
436
+
437
+ <!--
438
+ ### Downstream Usage (Sentence Transformers)
439
+
440
+ You can finetune this model on your own dataset.
441
+
442
+ <details><summary>Click to expand</summary>
443
+
444
+ </details>
445
+ -->
446
+
447
+ <!--
448
+ ### Out-of-Scope Use
449
+
450
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
451
+ -->
452
+
453
+ ## Evaluation
454
+
455
+ ### Metrics
456
+
457
+ #### Triplet
458
+
459
+ * Dataset: `all-nli-test`
460
+ * Evaluated with [<code>TripletEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.TripletEvaluator)
461
+
462
+ | Metric | Value |
463
+ |:--------------------|:--------|
464
+ | **cosine_accuracy** | **1.0** |
465
+
466
+ <!--
467
+ ## Bias, Risks and Limitations
468
+
469
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
470
+ -->
471
+
472
+ <!--
473
+ ### Recommendations
474
+
475
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
476
+ -->
477
+
478
+ ## Training Details
479
+
480
+ ### Training Dataset
481
+
482
+ #### invoices_embedding_2
483
+
484
+ * Dataset: [invoices_embedding_2](https://huggingface.co/datasets/Noureddinesa/Invoices_embedding_2) at [af1df68](https://huggingface.co/datasets/Noureddinesa/Invoices_embedding_2/tree/af1df689b81bb7a4dbc2112a4645ac578b49dba4)
485
+ * Size: 387 training samples
486
+ * Columns: <code>anchor</code>, <code>positive</code>, and <code>negative</code>
487
+ * Approximate statistics based on the first 387 samples:
488
+ | | anchor | positive | negative |
489
+ |:--------|:-----------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|
490
+ | type | string | string | string |
491
+ | details | <ul><li>min: 12 tokens</li><li>mean: 37.6 tokens</li><li>max: 140 tokens</li></ul> | <ul><li>min: 274 tokens</li><li>mean: 377.78 tokens</li><li>max: 507 tokens</li></ul> | <ul><li>min: 217 tokens</li><li>mean: 424.29 tokens</li><li>max: 655 tokens</li></ul> |
492
+ * Samples:
493
+ | anchor | positive | negative |
494
+ |:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
495
+ | <code>Un expert juridique est rémunéré pour une expertise dans le cadre d'une enquête.</code> | <code>Ce compte enregistre les paiements effectués pour des services d'intermédiaires et d'honoraires. Cela inclut les commissions versées à des agents commerciaux, les honoraires d'avocats ou d'experts-comptables, ainsi que les frais liés aux actes juridiques et aux contentieux.<br><br>1. Une entreprise paie une commission de 5% à un agent immobilier pour la vente d'un bien. 2. Un avocat reçoit un honoraire de 150 euros pour une consultation juridique. 3. Un expert-comptable facture 1 000 euros pour la préparation des états financiers d'une entreprise. 4. Un notaire est rémunéré pour 300 euros pour la rédaction d'un acte de vente. 5. Une société paie des frais de 200 euros à un huissier pour l'exécution d'un jugement. 6. Un consultant reçoit 800 euros pour un audit de l'entreprise. 7. Une agence de publicité perçoit une commission de 10% sur les ventes générées par une campagne. 8. Un courtier en assurance est rémunéré pour une prime de 2 500 euros. 9. Un architecte facture 5 000 euros pour la co...</code> | <code>Ce compte enregistre des dépenses d'exploitation des années précédentes qui n'ont pas encore été enregistrées dans la comptabilité.<br><br>1. Une facture d'électricité de l'année précédente non payée. 2. Des frais de réparation d'équipement non comptabilisés l'année passée. 3. Un loyer impayé d'un mois de l'année précédente. 4. Des coûts de maintenance de machines non enregistrés. 5. Des primes non versées aux employés pour l'année précédente. 6. Des frais juridiques liés à une affaire de l'année dernière. 7. Un abonnement à un service non facturé l'année passée. 8. Des charges sociales d'un employé pour un trimestre antérieur. 9. Une dépense de publicité non comptabilisée pour l'année précédente. 10. Des frais de déplacement d'un employé non remboursés de l'année passée. 11. Des achats de fournitures de bureau non enregistrés. 12. Des frais de formation pour des employés non comptabilisés. 13. Des taxes payées en retard pour l'exercice précédent. 14. Des dépenses liées à des événements d'en...</code> |
496
+ | <code>L'entreprise PRO NUMERIQUE a reçu une facture du fournisseur CARROT pour un montant total de 1300,00 DH TTC. La facture comprend l'impression d'un écran Backlight pour un prix unitaire de 1083,33 DH HT, avec une TVA de 16,67%. Les informations de contact du fournisseur sont indiquées en bas de la page.<br>215 - Matériel informatique<br>Matériel informatique<br></code> | <code>Le compte des achats de travaux, études et prestations de services enregistre les dépenses liées à des services ou travaux réalisés par des tiers pour l'entreprise.<br><br>1. Une entreprise de construction engage un architecte pour concevoir un nouveau bâtiment.<br>2. Un restaurant paie un service de nettoyage professionnel pour entretenir ses locaux.<br>3. Une société de marketing externalise la création de son site web à une agence spécialisée.<br>4. Un cabinet médical fait appel à un service de comptabilité pour gérer ses finances.<br>5. Une entreprise de transport utilise une société externe pour des études de marché.<br>6. Une école embauche une agence pour organiser des événements scolaires.<br>7. Une société de sécurité paie une entreprise de gardiennage pour protéger ses locaux.<br>8. Un club sportif engage un entraîneur externe pour ses équipes.<br>9. Une société de production audiovisuelle sous-traite la post-production d'un film.<br>10. Une entreprise de logiciels recrute des développeurs freelance pour un ...</code> | <code>Les achats de marchandises « groupe A » représentent les achats effectués par une entreprise pour des biens classés dans une catégorie spécifique, durant une période donnée. Ce compte permet de suivre les dépenses liées aux marchandises de ce groupe et de gérer la TVA associée.<br><br>1. Une épicerie achète des fruits et légumes pour reconstituer son stock. 2. Un magasin de vêtements acquiert des nouvelles collections pour la saison. 3. Un restaurant achète des ingrédients pour préparer ses plats. 4. Une librairie se procure des livres d'un nouvel auteur. 5. Un fournisseur de matériel informatique achète des ordinateurs pour les revendre. 6. Une boutique de cosmétiques fait un achat de produits de beauté en gros. 7. Une entreprise de construction achète des matériaux de construction comme du ciment et des briques. 8. Une société d'événementiel acquiert des décorations pour un mariage. 9. Un café achète du café et du thé pour ses clients. 10. Un fleuriste commande des fleurs pour ses arrangem...</code> |
497
+ | <code>L'entreprise a organisé un événement de lancement avec des frais répartis sur plusieurs mois afin de toucher un large public.</code> | <code>Les frais de publicité sont des dépenses engagées pour promouvoir un produit ou un service, souvent réparties sur plusieurs années, comme les frais de participation à des foires ou l'impression de grandes quantités de catalogues.<br><br>1. Participer à un salon professionnel pour présenter une nouvelle gamme de produits. 2. Imprimer 10 000 brochures pour une campagne marketing. 3. Louer un espace publicitaire dans un magazine pendant plusieurs mois. 4. Développer une campagne publicitaire à la télévision sur plusieurs semaines. 5. Créer et diffuser une série de publicités sur les réseaux sociaux pendant un an. 6. Concevoir un site web pour promouvoir un événement sur plusieurs années. 7. Organiser un événement de lancement avec des frais répartis sur plusieurs mois. 8. Distribuer des échantillons gratuits dans les supermarchés sur une période prolongée. 9. Produire des vidéos promotionnelles qui seront utilisées pendant plusieurs saisons. 10. Acheter des panneaux d'affichage pour une campagn...</code> | <code>Le compte des frais postaux et de télécommunication enregistre les dépenses liées à l'envoi de courrier et aux communications électroniques. Cela inclut l'achat de timbres, d'enveloppes préaffranchies, les frais de téléphone, les télégrammes et les envois de fax.<br><br>1. Achat de timbres pour envoyer des lettres. 2. Paiement d'une facture de téléphone fixe. 3. Achat d'enveloppes préaffranchies pour des envois rapides. 4. Envoi d'un télégramme pour une annonce urgente. 5. Utilisation d'un service de fax pour transmettre un document officiel. 6. Abonnement à un service de messagerie instantanée pour communiquer avec des clients. 7. Réception d'une facture de téléphone mobile. 8. Envoi d'une carte postale pendant les vacances. 9. Paiement pour un service de téléconférence. 10. Envoi de messages via un service de télex. 11. Achat de cartes de téléphone prépayées. 12. Frais d'un service d'envoi express pour des documents importants. 13. Utilisation d'un service de messagerie pour livrer des col...</code> |
498
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
499
+ ```json
500
+ {
501
+ "scale": 20.0,
502
+ "similarity_fct": "cos_sim"
503
+ }
504
+ ```
505
+
506
+ ### Evaluation Dataset
507
+
508
+ #### invoices_embedding_2
509
+
510
+ * Dataset: [invoices_embedding_2](https://huggingface.co/datasets/Noureddinesa/Invoices_embedding_2) at [af1df68](https://huggingface.co/datasets/Noureddinesa/Invoices_embedding_2/tree/af1df689b81bb7a4dbc2112a4645ac578b49dba4)
511
+ * Size: 49 evaluation samples
512
+ * Columns: <code>anchor</code>, <code>positive</code>, and <code>negative</code>
513
+ * Approximate statistics based on the first 49 samples:
514
+ | | anchor | positive | negative |
515
+ |:--------|:------------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|
516
+ | type | string | string | string |
517
+ | details | <ul><li>min: 17 tokens</li><li>mean: 38.29 tokens</li><li>max: 126 tokens</li></ul> | <ul><li>min: 274 tokens</li><li>mean: 376.78 tokens</li><li>max: 507 tokens</li></ul> | <ul><li>min: 319 tokens</li><li>mean: 432.14 tokens</li><li>max: 655 tokens</li></ul> |
518
+ * Samples:
519
+ | anchor | positive | negative |
520
+ |:---------------------------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
521
+ | <code>L'achat concerne des emballages en plastique pour protéger des produits fragiles lors de leur transport dans l'industrie.</code> | <code>Les achats d'emballages concernent l'acquisition de matériaux utilisés pour conditionner des produits, incluant les emballages perdus, récupérables et à usage mixte.<br><br>1. Achat de cartons pour expédier des marchandises. 2. Acquisition de bouteilles en plastique pour une boisson. 3. Commande de tonneaux en métal pour le stockage. 4. Récupération de caisses en bois d'un fournisseur. 5. Achat de sacs en papier pour des produits alimentaires. 6. Commande d'emballages en polystyrène pour protéger des objets fragiles. 7. Utilisation de bouteilles en verre pour des jus de fruits. 8. Acquisition d'emballages biodégradables pour des produits cosmétiques. 9. Achat de film plastique pour envelopper des palettes. 10. Commande de boîtes en métal pour des conserves. 11. Récupération d'emballages à usage mixte pour un événement. 12. Achat de barquettes en plastique pour des plats à emporter. 13. Commande de pots en verre pour des confitures. 14. Utilisation de caisses en carton pour le transport de vê...</code> | <code>Les autres charges à répartir sont des frais significatifs qui ne peuvent pas être entièrement couverts dans une seule période comptable et doivent donc être étalés sur plusieurs exercices. Cela inclut, par exemple, les coûts liés à des projets de recherche ou d'autres investissements à long terme.<br><br>1. Coûts de lancement d'un produit étalés sur plusieurs années. 2. Frais de formation des employés répartis sur plusieurs exercices. 3. Dépenses de publicité pour une campagne qui dure plusieurs mois ou années. 4. Coûts de rénovation d'un bâtiment amortis sur plusieurs années. 5. Investissements en technologie étalés sur la durée de vie de l'équipement. 6. Charges liées à un contrat de service de plusieurs années. 7. Dépenses pour un événement annuel réparties sur plusieurs exercices. 8. Coûts de développement d'un logiciel amortis sur sa durée d'utilisation. 9. Frais juridiques pour un procès étalés sur les années de litige. 10. Dépenses d'acquisition d'une licence réparties sur sa durée d...</code> |
522
+ | <code>L'achat porte sur des meubles de rangement pour organiser les fournitures de bureau dans un environnement de travail.</code> | <code>Le mobilier de bureau désigne l'ensemble des meubles utilisés dans un espace de travail, tels que les bureaux, chaises, tables et rangements, qui contribuent à l'organisation et au confort des employés.<br><br>1. Un bureau en bois massif dans un cabinet d'architecte. 2. Des chaises ergonomiques dans une salle de réunion. 3. Un espace de travail avec des tables modulables dans une start-up. 4. Des étagères pour ranger des dossiers dans un bureau administratif. 5. Un comptoir d'accueil dans une entreprise. 6. Des fauteuils confortables dans une salle d'attente. 7. Un bureau debout pour favoriser une meilleure posture. 8. Des meubles de rangement pour les fournitures de bureau. 9. Une table de conférence pour les réunions d'équipe. 10. Un bureau partagé dans un espace de coworking. 11. Des casiers pour les effets personnels des employés. 12. Un meuble TV dans une salle de pause. 13. Des panneaux de séparation pour créer des espaces privés. 14. Des meubles de rangement pour l'équipement informat...</code> | <code>Les impôts, taxes et droits assimilés sont des prélèvements obligatoires que les citoyens et entreprises doivent payer à l'État ou à des collectivités. Cela inclut des frais comme les droits d'enregistrement, les taxes sur les véhicules et d'autres impôts non spécifiquement classés ailleurs.<br><br>1. La taxe d'habitation que vous payez chaque année. 2. La vignette automobile pour pouvoir circuler avec votre véhicule. 3. Les droits d'enregistrement lors de l'achat d'un bien immobilier. 4. La taxe sur les produits pétroliers lorsque vous faites le plein. 5. Les frais de timbre pour légaliser un document. 6. La taxe sur les spectacles pour assister à un concert. 7. Les impôts sur les sociétés que les entreprises doivent payer sur leurs bénéfices. 8. La taxe sur la valeur ajoutée (TVA) incluse dans vos achats. 9. Les droits d'accise sur les boissons alcoolisées. 10. La taxe foncière sur les propriétés immobilières. 11. Les frais pour le renouvellement de votre carte grise. 12. La contribution à...</code> |
523
+ | <code>Un terminal portuaire équipé de systèmes automatisés pour gérer le chargement et le déchargement de marchandises.</code> | <code>Les installations techniques sont des ensembles de biens, matériels et constructions, qui fonctionnent ensemble. La séparation de l'un d'eux compromet l'utilité des autres. Par exemple, une salle de serveurs est une installation technique si elle est spécialement conçue pour accueillir des équipements informatiques, et retirer ces équipements rend la salle inutile.<br><br>1. Une salle de serveurs dédiée à des ordinateurs.<br>2. Un système de climatisation installé pour maintenir la température dans une usine.<br>3. Un ascenseur conçu uniquement pour desservir un bâtiment commercial.<br>4. Un réseau de plomberie dans un immeuble résidentiel.<br>5. Un système électrique spécifique à une chaîne de production.<br>6. Un laboratoire équipé de matériels scientifiques spécialisés.<br>7. Une cuisine professionnelle intégrée dans un restaurant.<br>8. Un parc de stationnement construit uniquement pour les véhicules d'une entreprise.<br>9. Un système de sécurité installé pour protéger un site industriel.<br>10. Une ligne de produ...</code> | <code>Les impôts et taxes indirects sont des prélèvements que l'on paie lors de l'achat de biens ou de services, sans qu'ils soient directement inclus dans le prix. Ils peuvent inclure des droits de douane, des taxes sur la valeur ajoutée (TVA) ou d'autres charges qui s'ajoutent au coût initial.<br><br>1. Lors de l'importation d'un produit, le droit de douane appliqué en plus du prix d'achat. 2. La TVA ajoutée à l'achat d'un vêtement dans un magasin. 3. Les taxes sur les carburants lors du remplissage d'un réservoir de voiture. 4. Les droits d'accise sur l'achat d'alcool ou de tabac dans un commerce. 5. Les frais de transport international qui incluent des taxes de passage. 6. Les tarifs d'importation sur des produits électroniques. 7. Les taxes sur les services de t��lécommunication comme la téléphonie mobile. 8. Les droits sur les produits alimentaires importés. 9. Les taxes environnementales sur les emballages de produits. 10. Les frais de douane pour l'importation de meubles. 11. Les taxes sur ...</code> |
524
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
525
+ ```json
526
+ {
527
+ "scale": 20.0,
528
+ "similarity_fct": "cos_sim"
529
+ }
530
+ ```
531
+
532
+ ### Training Hyperparameters
533
+ #### Non-Default Hyperparameters
534
+
535
+ - `eval_strategy`: steps
536
+ - `per_device_train_batch_size`: 16
537
+ - `per_device_eval_batch_size`: 16
538
+ - `num_train_epochs`: 1
539
+ - `warmup_ratio`: 0.1
540
+ - `fp16`: True
541
+ - `batch_sampler`: no_duplicates
542
+
543
+ #### All Hyperparameters
544
+ <details><summary>Click to expand</summary>
545
+
546
+ - `overwrite_output_dir`: False
547
+ - `do_predict`: False
548
+ - `eval_strategy`: steps
549
+ - `prediction_loss_only`: True
550
+ - `per_device_train_batch_size`: 16
551
+ - `per_device_eval_batch_size`: 16
552
+ - `per_gpu_train_batch_size`: None
553
+ - `per_gpu_eval_batch_size`: None
554
+ - `gradient_accumulation_steps`: 1
555
+ - `eval_accumulation_steps`: None
556
+ - `torch_empty_cache_steps`: None
557
+ - `learning_rate`: 5e-05
558
+ - `weight_decay`: 0.0
559
+ - `adam_beta1`: 0.9
560
+ - `adam_beta2`: 0.999
561
+ - `adam_epsilon`: 1e-08
562
+ - `max_grad_norm`: 1.0
563
+ - `num_train_epochs`: 1
564
+ - `max_steps`: -1
565
+ - `lr_scheduler_type`: linear
566
+ - `lr_scheduler_kwargs`: {}
567
+ - `warmup_ratio`: 0.1
568
+ - `warmup_steps`: 0
569
+ - `log_level`: passive
570
+ - `log_level_replica`: warning
571
+ - `log_on_each_node`: True
572
+ - `logging_nan_inf_filter`: True
573
+ - `save_safetensors`: True
574
+ - `save_on_each_node`: False
575
+ - `save_only_model`: False
576
+ - `restore_callback_states_from_checkpoint`: False
577
+ - `no_cuda`: False
578
+ - `use_cpu`: False
579
+ - `use_mps_device`: False
580
+ - `seed`: 42
581
+ - `data_seed`: None
582
+ - `jit_mode_eval`: False
583
+ - `use_ipex`: False
584
+ - `bf16`: False
585
+ - `fp16`: True
586
+ - `fp16_opt_level`: O1
587
+ - `half_precision_backend`: auto
588
+ - `bf16_full_eval`: False
589
+ - `fp16_full_eval`: False
590
+ - `tf32`: None
591
+ - `local_rank`: 0
592
+ - `ddp_backend`: None
593
+ - `tpu_num_cores`: None
594
+ - `tpu_metrics_debug`: False
595
+ - `debug`: []
596
+ - `dataloader_drop_last`: False
597
+ - `dataloader_num_workers`: 0
598
+ - `dataloader_prefetch_factor`: None
599
+ - `past_index`: -1
600
+ - `disable_tqdm`: False
601
+ - `remove_unused_columns`: True
602
+ - `label_names`: None
603
+ - `load_best_model_at_end`: False
604
+ - `ignore_data_skip`: False
605
+ - `fsdp`: []
606
+ - `fsdp_min_num_params`: 0
607
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
608
+ - `fsdp_transformer_layer_cls_to_wrap`: None
609
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
610
+ - `deepspeed`: None
611
+ - `label_smoothing_factor`: 0.0
612
+ - `optim`: adamw_torch
613
+ - `optim_args`: None
614
+ - `adafactor`: False
615
+ - `group_by_length`: False
616
+ - `length_column_name`: length
617
+ - `ddp_find_unused_parameters`: None
618
+ - `ddp_bucket_cap_mb`: None
619
+ - `ddp_broadcast_buffers`: False
620
+ - `dataloader_pin_memory`: True
621
+ - `dataloader_persistent_workers`: False
622
+ - `skip_memory_metrics`: True
623
+ - `use_legacy_prediction_loop`: False
624
+ - `push_to_hub`: False
625
+ - `resume_from_checkpoint`: None
626
+ - `hub_model_id`: None
627
+ - `hub_strategy`: every_save
628
+ - `hub_private_repo`: False
629
+ - `hub_always_push`: False
630
+ - `gradient_checkpointing`: False
631
+ - `gradient_checkpointing_kwargs`: None
632
+ - `include_inputs_for_metrics`: False
633
+ - `include_for_metrics`: []
634
+ - `eval_do_concat_batches`: True
635
+ - `fp16_backend`: auto
636
+ - `push_to_hub_model_id`: None
637
+ - `push_to_hub_organization`: None
638
+ - `mp_parameters`:
639
+ - `auto_find_batch_size`: False
640
+ - `full_determinism`: False
641
+ - `torchdynamo`: None
642
+ - `ray_scope`: last
643
+ - `ddp_timeout`: 1800
644
+ - `torch_compile`: False
645
+ - `torch_compile_backend`: None
646
+ - `torch_compile_mode`: None
647
+ - `dispatch_batches`: None
648
+ - `split_batches`: None
649
+ - `include_tokens_per_second`: False
650
+ - `include_num_input_tokens_seen`: False
651
+ - `neftune_noise_alpha`: None
652
+ - `optim_target_modules`: None
653
+ - `batch_eval_metrics`: False
654
+ - `eval_on_start`: False
655
+ - `use_liger_kernel`: False
656
+ - `eval_use_gather_object`: False
657
+ - `average_tokens_across_devices`: False
658
+ - `prompts`: None
659
+ - `batch_sampler`: no_duplicates
660
+ - `multi_dataset_batch_sampler`: proportional
661
+
662
+ </details>
663
+
664
+ ### Training Logs
665
+ | Epoch | Step | all-nli-test_cosine_accuracy |
666
+ |:-----:|:----:|:----------------------------:|
667
+ | 1.0 | 25 | 1.0 |
668
+
669
+
670
+ ### Framework Versions
671
+ - Python: 3.10.12
672
+ - Sentence Transformers: 3.3.1
673
+ - Transformers: 4.46.3
674
+ - PyTorch: 2.5.1+cu121
675
+ - Accelerate: 1.1.1
676
+ - Datasets: 3.2.0
677
+ - Tokenizers: 0.20.3
678
+
679
+ ## Citation
680
+
681
+ ### BibTeX
682
+
683
+ #### Sentence Transformers
684
+ ```bibtex
685
+ @inproceedings{reimers-2019-sentence-bert,
686
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
687
+ author = "Reimers, Nils and Gurevych, Iryna",
688
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
689
+ month = "11",
690
+ year = "2019",
691
+ publisher = "Association for Computational Linguistics",
692
+ url = "https://arxiv.org/abs/1908.10084",
693
+ }
694
+ ```
695
+
696
+ #### MultipleNegativesRankingLoss
697
+ ```bibtex
698
+ @misc{henderson2017efficient,
699
+ title={Efficient Natural Language Response Suggestion for Smart Reply},
700
+ author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
701
+ year={2017},
702
+ eprint={1705.00652},
703
+ archivePrefix={arXiv},
704
+ primaryClass={cs.CL}
705
+ }
706
+ ```
707
+
708
+ <!--
709
+ ## Glossary
710
+
711
+ *Clearly define terms in order to be accessible across audiences.*
712
+ -->
713
+
714
+ <!--
715
+ ## Model Card Authors
716
+
717
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
718
+ -->
719
+
720
+ <!--
721
+ ## Model Card Contact
722
+
723
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
724
+ -->
config.json ADDED
@@ -0,0 +1,58 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "nomic-ai/nomic-embed-text-v1.5",
3
+ "activation_function": "swiglu",
4
+ "architectures": [
5
+ "NomicBertModel"
6
+ ],
7
+ "attn_pdrop": 0.0,
8
+ "auto_map": {
9
+ "AutoConfig": "nomic-ai/nomic-bert-2048--configuration_hf_nomic_bert.NomicBertConfig",
10
+ "AutoModel": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertModel",
11
+ "AutoModelForMaskedLM": "nomic-ai/nomic-bert-2048--modeling_hf_nomic_bert.NomicBertForPreTraining"
12
+ },
13
+ "bos_token_id": null,
14
+ "causal": false,
15
+ "dense_seq_output": true,
16
+ "embd_pdrop": 0.0,
17
+ "eos_token_id": null,
18
+ "fused_bias_fc": true,
19
+ "fused_dropout_add_ln": true,
20
+ "initializer_range": 0.02,
21
+ "layer_norm_epsilon": 1e-12,
22
+ "max_trained_positions": 2048,
23
+ "mlp_fc1_bias": false,
24
+ "mlp_fc2_bias": false,
25
+ "model_type": "nomic_bert",
26
+ "n_embd": 768,
27
+ "n_head": 12,
28
+ "n_inner": 3072,
29
+ "n_layer": 12,
30
+ "n_positions": 8192,
31
+ "pad_vocab_size_multiple": 64,
32
+ "parallel_block": false,
33
+ "parallel_block_tied_norm": false,
34
+ "prenorm": false,
35
+ "qkv_proj_bias": false,
36
+ "reorder_and_upcast_attn": false,
37
+ "resid_pdrop": 0.0,
38
+ "rotary_emb_base": 1000,
39
+ "rotary_emb_fraction": 1.0,
40
+ "rotary_emb_interleaved": false,
41
+ "rotary_emb_scale_base": null,
42
+ "rotary_scaling_factor": null,
43
+ "scale_attn_by_inverse_layer_idx": false,
44
+ "scale_attn_weights": true,
45
+ "summary_activation": null,
46
+ "summary_first_dropout": 0.0,
47
+ "summary_proj_to_labels": true,
48
+ "summary_type": "cls_index",
49
+ "summary_use_proj": true,
50
+ "torch_dtype": "float32",
51
+ "transformers_version": "4.46.3",
52
+ "type_vocab_size": 2,
53
+ "use_cache": true,
54
+ "use_flash_attn": true,
55
+ "use_rms_norm": false,
56
+ "use_xentropy": true,
57
+ "vocab_size": 30528
58
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.3.1",
4
+ "transformers": "4.46.3",
5
+ "pytorch": "2.5.1+cu121"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": "cosine"
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:1228b4488ee21f2c0a41f7a651d3f97ed62d0e9301f41d526a1789829d3c64a9
3
+ size 546938168
modules.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ }
14
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 8192,
3
+ "do_lower_case": false
4
+ }
special_tokens_map.json ADDED
@@ -0,0 +1,37 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "cls_token": {
3
+ "content": "[CLS]",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "mask_token": {
10
+ "content": "[MASK]",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "pad_token": {
17
+ "content": "[PAD]",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "sep_token": {
24
+ "content": "[SEP]",
25
+ "lstrip": false,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "unk_token": {
31
+ "content": "[UNK]",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ }
37
+ }
tokenizer.json ADDED
The diff for this file is too large to render. See raw diff
 
tokenizer_config.json ADDED
@@ -0,0 +1,55 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "[PAD]",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "100": {
12
+ "content": "[UNK]",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "101": {
20
+ "content": "[CLS]",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "102": {
28
+ "content": "[SEP]",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "103": {
36
+ "content": "[MASK]",
37
+ "lstrip": false,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "clean_up_tokenization_spaces": true,
45
+ "cls_token": "[CLS]",
46
+ "do_lower_case": true,
47
+ "mask_token": "[MASK]",
48
+ "model_max_length": 8192,
49
+ "pad_token": "[PAD]",
50
+ "sep_token": "[SEP]",
51
+ "strip_accents": null,
52
+ "tokenize_chinese_chars": true,
53
+ "tokenizer_class": "BertTokenizer",
54
+ "unk_token": "[UNK]"
55
+ }
vocab.txt ADDED
The diff for this file is too large to render. See raw diff