meandyou200175
commited on
Commit
•
ee7dd03
1
Parent(s):
c365d43
Add new SentenceTransformer model
Browse files- .gitattributes +1 -0
- 1_Pooling/config.json +10 -0
- README.md +904 -0
- config.json +28 -0
- config_sentence_transformers.json +10 -0
- model.safetensors +3 -0
- modules.json +20 -0
- sentence_bert_config.json +4 -0
- sentencepiece.bpe.model +3 -0
- special_tokens_map.json +51 -0
- tokenizer.json +3 -0
- tokenizer_config.json +54 -0
.gitattributes
CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
|
|
33 |
*.zip filter=lfs diff=lfs merge=lfs -text
|
34 |
*.zst filter=lfs diff=lfs merge=lfs -text
|
35 |
*tfevents* filter=lfs diff=lfs merge=lfs -text
|
|
|
|
33 |
*.zip filter=lfs diff=lfs merge=lfs -text
|
34 |
*.zst filter=lfs diff=lfs merge=lfs -text
|
35 |
*tfevents* filter=lfs diff=lfs merge=lfs -text
|
36 |
+
tokenizer.json filter=lfs diff=lfs merge=lfs -text
|
1_Pooling/config.json
ADDED
@@ -0,0 +1,10 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"word_embedding_dimension": 768,
|
3 |
+
"pooling_mode_cls_token": false,
|
4 |
+
"pooling_mode_mean_tokens": true,
|
5 |
+
"pooling_mode_max_tokens": false,
|
6 |
+
"pooling_mode_mean_sqrt_len_tokens": false,
|
7 |
+
"pooling_mode_weightedmean_tokens": false,
|
8 |
+
"pooling_mode_lasttoken": false,
|
9 |
+
"include_prompt": true
|
10 |
+
}
|
README.md
ADDED
@@ -0,0 +1,904 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
---
|
2 |
+
base_model: intfloat/multilingual-e5-base
|
3 |
+
library_name: sentence-transformers
|
4 |
+
metrics:
|
5 |
+
- cosine_accuracy@1
|
6 |
+
- cosine_accuracy@3
|
7 |
+
- cosine_accuracy@5
|
8 |
+
- cosine_accuracy@10
|
9 |
+
- cosine_precision@1
|
10 |
+
- cosine_precision@3
|
11 |
+
- cosine_precision@5
|
12 |
+
- cosine_precision@10
|
13 |
+
- cosine_recall@1
|
14 |
+
- cosine_recall@3
|
15 |
+
- cosine_recall@5
|
16 |
+
- cosine_recall@10
|
17 |
+
- cosine_ndcg@10
|
18 |
+
- cosine_mrr@10
|
19 |
+
- cosine_map@100
|
20 |
+
- dot_accuracy@1
|
21 |
+
- dot_accuracy@3
|
22 |
+
- dot_accuracy@5
|
23 |
+
- dot_accuracy@10
|
24 |
+
- dot_precision@1
|
25 |
+
- dot_precision@3
|
26 |
+
- dot_precision@5
|
27 |
+
- dot_precision@10
|
28 |
+
- dot_recall@1
|
29 |
+
- dot_recall@3
|
30 |
+
- dot_recall@5
|
31 |
+
- dot_recall@10
|
32 |
+
- dot_ndcg@10
|
33 |
+
- dot_mrr@10
|
34 |
+
- dot_map@100
|
35 |
+
pipeline_tag: sentence-similarity
|
36 |
+
tags:
|
37 |
+
- sentence-transformers
|
38 |
+
- sentence-similarity
|
39 |
+
- feature-extraction
|
40 |
+
- generated_from_trainer
|
41 |
+
- dataset_size:43804
|
42 |
+
- loss:MultipleNegativesRankingLoss
|
43 |
+
widget:
|
44 |
+
- source_sentence: Nhờ bác sĩ cho biết việc lựa chọn đóng đinh nội tủy và nẹp vít
|
45 |
+
để kết hợp xương đòn dựa trên cơ sở nào ạ? Ca phẫu thuật thường kéo dài trong
|
46 |
+
bao lâu? Bệnh nhân nằm viện mấy ngày?
|
47 |
+
sentences:
|
48 |
+
- ' Chào em, là bệnh mãn tính phải điều trị suốt đời, phải kiên nhẫn và kiên trì
|
49 |
+
nên đôi khi lượng đường trong cơ thể không ổn định. Lúc đi khám xét nghiệm thì
|
50 |
+
ổn do bản thân biết mai đi khám nên sẽ kiêng ăn, ăn ít... còn bệnh lâu dài nên
|
51 |
+
trong ngày đôi khi thèm chút này hay thích ăn chút kia, quên uống thuốc, suy
|
52 |
+
nghĩ, mất ngủ cũng làm đường không ổn định. Đường trong cơ thể lúc lên lúc xuống
|
53 |
+
dễ đưa đến biến chứng. Em hay thấy bệnh nhân tiểu đường tháo khớp ngón chân, ngón
|
54 |
+
tay, đôi khi tháo khớp gối, khớp háng, đây là do tê liệt hệ thần kinh nên khi
|
55 |
+
va chạm bệnh nhân không phát hiện. Đến khi phát hiện thì đã nhiễm trùng nặng phải
|
56 |
+
tháo khớp. Theo BS mẹ em có khả năng do biến chứng tiểu đường vì mẹ em bị bệnh
|
57 |
+
khá lâu nên ít nhiều ảnh hưởng thần kinh bị tê liệt gây đau. Em nên nhớ dặn mẹ
|
58 |
+
đi tái khám và điều trị cho thật ổn định nhé! Thân mến!'
|
59 |
+
- ' Để lựa chọn phương pháp đóng đinh nội tủy hay nẹp vít cho bệnh nhân cần dựa
|
60 |
+
vào nhiều yếu tố. Trong lòng tủy xương có một cái ống, nếu lòng tủy bệnh nhân
|
61 |
+
nhỏ mà đường gãy không bị gãy thành nhiều mảnh thì nên lựa chọn phương pháp đóng
|
62 |
+
đinh. Phương pháp này có nhược điểm dễ bị lộ phần đinh khi đinh vừa đóng, chưa
|
63 |
+
chắc vào xương. Tuy nhiên, ưu điểm là khi đóng đinh, đường mổ sẽ nhỏ, đơn giản.
|
64 |
+
Đối với nẹp vít, đường mổ dài hơn nhưng phần nắn chỉnh sẽ tuyệt đối, vững chắc
|
65 |
+
hơn. Nhìn chung, giữa 2 phương pháp thời gian mổ không khác biệt nhau nhiều, từ
|
66 |
+
30-45 phút sẽ hoàn thành cuộc phẫu thuật kết hợp xương. Tại bệnh viện Nhân dân
|
67 |
+
115, sau khi bệnh nhân được làm phẫu thuật có thể xuất viện rất sớm trong vòng
|
68 |
+
khoảng 3-5 ngày, tùy theo đường mổ lớn hay nhỏ. Giữa việc lựa chọn phẫu thuật
|
69 |
+
hay bảo tồn, đinh nội tủy hay nẹp vít phụ thuộc vào lòng tủy của bệnh nhân và
|
70 |
+
thói quen, sự đánh giá của phẫu thuật viên. Cá nhân tôi thường lựa chọn phương
|
71 |
+
pháp phẫu thuật nẹp vít sẽ cho kết quả nắn chỉnh tốt, chắc hơn và bệnh nhân không
|
72 |
+
bị biến chứng trồi đinh về sau. Thân mến.'
|
73 |
+
- Chào em, Tình trạng người mệt mỏi, khó thở, tim đập nhanh xảy ra khi không gắng
|
74 |
+
sức có thể do nhiều nguyên nhân, gồm tim mạch, hô hấp, thần kinh cơ, tiêu hóa
|
75 |
+
(chủ yếu là ống tiêu hóa trên), tâm lý, bệnh lý nội tiết tố… Viêm dạ dày trào
|
76 |
+
ngược có thể gây các triệu chứng này do dịch acid trào ngược từ dạ dày lên thực
|
77 |
+
quản kích thích thần kinh tim. Mặt khác bệnh dạ dày là bệnh có thể tái phát, điều
|
78 |
+
trị hết bệnh rồi thì bệnh vẫn có thể tái lại. Do đó, nếu em đã khám tim mạch và
|
79 |
+
hô hấp bình thường, để biết có phải mình mệt mỏi do bệnh dạ dày gây ra hay không
|
80 |
+
thì tốt nhất là em khám chuyên khoa nội tiêu hóa và điều trị trào ngược dạ dày
|
81 |
+
thực quản thử, nếu triệu chứng cải thiện nhanh chóng thì chính hắn là nguyên nhân,
|
82 |
+
em nhé.
|
83 |
+
- source_sentence: Tôi bị tình trạng nuốt nước miếng có cảm giác bị vướng ở cổ, không
|
84 |
+
đau rát, không ho sốt, ăn uống bình thường đã 1 ngày nay. Chỉ có nuốt nước miếng
|
85 |
+
là có cảm giác vướng thôi, lỗ tai bên trái thì cảm giác ngứa nhẹ. Xin hỏi là bệnh
|
86 |
+
gì vậy ạ?
|
87 |
+
sentences:
|
88 |
+
- "Em Lan thân mến, Hiện nay, xét nghiệm được xem là một xét nghiệm\r\nthường quy,\
|
89 |
+
\ nên thai kỳ của em cũng rất cần được làm những xét nghiệm này mặc\r\ndù gia\
|
90 |
+
\ đình em không có bệnh lý bất thường. Tuy nhiên, thai kỳ của em đã qua thời gian\
|
91 |
+
\ làm xét nghiệm Double test, bây\r\ngiờ em phải chờ đến lúc thai được 16 – 18\
|
92 |
+
\ tuần tuổi, làm xét nghiệm Triple test\r\nem nhé! Chúc em và bé khỏe mạnh!"
|
93 |
+
- 'Trường hợp thoái hóa cột sống thắt lưng gây đau mỏi liên tục dù đã dùng thuốc
|
94 |
+
giảm đau liều cao Chào em, Thoái hóa khớp, thoái hóa cột sống là tiến trình lão
|
95 |
+
hóa không thể tránh khỏi của con người, đặc biệt có thể xảy ra sớm và nhanh hơn
|
96 |
+
ở người nữ sau mãn kinh, sinh nở nhiều, suy dinh dưỡng hay ăn uống thiếu chất
|
97 |
+
khoáng, lao động vất vả lúc còn trẻ. Trường hợp thoái hóa cột sống thắt lưng gây
|
98 |
+
đau mỏi liên tục dù đã dùng thuốc giảm đau liều cao, đặc biệt là đau lan xuống
|
99 |
+
hai chân, tê yếu hai chân thì cần chụp MRI cột sống để tầm soát thoát vị đĩa đệm
|
100 |
+
chèn ép tủy sống. Trường hợp của em, mới phát hiện thoái hóa cột sống thắt lưng
|
101 |
+
gần đây, cũng mới uống thuốc 1 tuần và không duy trì nữa, việc đau lưng vẫn còn
|
102 |
+
âm ỉ nhưng không lan xuống hai chân thì chưa đến mức cần chụp MRI cột sống thắt
|
103 |
+
lưng. Nhưng mà, em cần tích cực điều trị để bệnh thoái hóa cột sống thắt lưng
|
104 |
+
không tiến triển nặng hơn. Bệnh này trị khỏi hoàn toàn là không thể, vì sinh lão
|
105 |
+
bệnh tử không thể cải hoàn, nhưng mà việc điều trị tích cực sẽ giúp khống chế
|
106 |
+
được bệnh, giảm đau và giảm tốc độ tiến triển của bệnh. Về việc sử dụng thuốc,
|
107 |
+
dù là thuốc Tây hay thuốc Đông y, em cũng cần phải thăm khám bs ck cơ xương khớp
|
108 |
+
(Tây y) hay ck y học cổ truyền (Đông y) để được kê thuốc phù hợp. các thuốc thường
|
109 |
+
dùng là giảm đau, giãn cơ, bổ sung vi khoáng chất (canxi, vitamin D3, magie...).
|
110 |
+
Bên cạnh đó, về phương pháp giảm đau hỗ trợ không dùng thuốc, em nên chú ý: -
|
111 |
+
Chú ý thay đổi tư thế trong quá trình làm việc, không giữ mãi một tư thế trong
|
112 |
+
nhiều giờ liền. Ngồi làm việc đúng tư thế để tránh các bệnh cột sống. - Vận động
|
113 |
+
đúng cách, khi vác vật nặng không vặn cột sống. - Thường xuyên tập thể dục rèn
|
114 |
+
luyện để cột sống vững chắc, cơ thể dẻo dai, bơi cũng được mà yoga là tốt nhất.
|
115 |
+
- Ăn uống khoa học, xây dựng chế độ dinh dưỡng hợp lý, tăng cường nhóm thực phẩm
|
116 |
+
giàu canxi, vitamin D, omega 3… giúp nâng cao độ chắc khỏe của đĩa đệm cũng như
|
117 |
+
xương khớp. - Duy trì cân nặng bình thường, tránh để tăng cân quá mức. - Tư thế
|
118 |
+
ngủ: nằm ngửa trên ván cứng hay nệm bông ép chặt, tránh nệm lò xo hay nệm cao
|
119 |
+
su quá mềm, có thể đệm ở vùng khoeo làm co nhẹ khớp gối và khớp háng, nên nằm
|
120 |
+
đầu thấp không gối sẽ tốt cho cột sống cổ. - Có thể thực hiện điều trị vật lý
|
121 |
+
và các liệu pháp phản xạ: bao gồm phương pháp nhiệt như chườm nóng (túi nước,
|
122 |
+
muối rang, cám rang, lá lốt, lá ngải cứu nóng); dùng các dòng điện tại khoa vật
|
123 |
+
lý trị liệu, điều trị bằng laser; châm cứu, kéo cơ để hỗ trợ giảm đau cơ cạnh
|
124 |
+
sống. Trân trọng!'
|
125 |
+
- Chào bạn, Nuốt vướng ở cổ thường gặp trong một số bệnh lý viêm nhiễm hầu họng
|
126 |
+
như viêm họng, viêm amidan mạn, trào ngược dạ dày thực quản, hội chứng chảy mũi
|
127 |
+
sau… Đây là có thể là triệu chứng đầu tiên báo hiệu một đợt bùng phát cấp tính
|
128 |
+
của viêm nhiễm hô hấp trên do triệu chứng mới chỉ xuất hiện 1 ngày. Bạn nên khám
|
129 |
+
bác sĩ Tai mũi họng để thăm khám trực tiếp, đánh giá và kê toa điều trị bạn nhé!
|
130 |
+
Thân mến.
|
131 |
+
- source_sentence: Chào bác sĩ, em bị gãy xương gót, đã đóng đinh đến nay được gần
|
132 |
+
5 tuần. Vậy 6 tuần em tháo đinh được chưa ạ?
|
133 |
+
sentences:
|
134 |
+
- ' Chào em, gồm 2 trị số, trị số lớn nhất gọi là huyết áp tâm thu, bình thường
|
135 |
+
< 140 và > 90 mmHg; trị số thấp nhất gọi là huyết áp tâm trương, bình thường <
|
136 |
+
90 và > 60 mmHg. Huyết áp có thể tăng khi căng thẳng, do lo lắng, do hội chứng
|
137 |
+
áo choàng trắng (khi vào bv, khi gặp bác sĩ thì huyết áp cao), bệnh lý viêm nhiễm,
|
138 |
+
do cafe, khi khó thở... nhìn chung là các stress đối với cơ thể. Như vậy, huyết
|
139 |
+
áp ghi nhận ở những lúc cơ thể đang lo lắng, bồn chồn, có bệnh thì sẽ không phản
|
140 |
+
ánh chính xác được huyết áp dao động bình thường của người bệnh. Do vậy em nên
|
141 |
+
khám chuyên khoa tim mạch, bác sĩ sẽ thăm khám và làm xét nghiệm kiểm tra xem
|
142 |
+
em có các dấu chứng của tăng huyết áp hay không (như dày thành tim, tiểu đạm,
|
143 |
+
đo huyết áp 24 giờ...) để xác định em có tăng huyết áp hay không và điều trị thích
|
144 |
+
hợp. Những triệu chứng hoa mắt, chóng mặt, đau đầu, đau 1 bên mắt, tiểu nhiều
|
145 |
+
có thể là do bệnh tăng huyết áp gây ra (ảnh hưởng lên mạch máu não, lên thận...)
|
146 |
+
hoặc là 1 bệnh lý khác như thiếu máu, rối loạn tiền đình, viêm nhiễm hệ thống,
|
147 |
+
viêm mũi xoang, bệnh lý mạch máu não... (và tăng huyết áp chỉ là phản ứng của
|
148 |
+
cơ thể khi có stress). Để tìm ra bệnh và giải quyết nỗi lo về bệnh, em nên đến
|
149 |
+
bệnh viện để kiểm tra sức khỏe em nhé. Thân mến! '
|
150 |
+
- ' Chào em, Thời điểm 6 tuần là quá sớm để rút đinh cố định xương gót (trừ trường
|
151 |
+
hợp khung cố định xương bên ngoài). Tháo đinh vít kim loại chỉ bắt buộc thực hiện
|
152 |
+
sớm trong những trường hợp bất thường như gãy vít, nhiễm trùng, khớp giả... gây
|
153 |
+
ra các triệu chứng bất thường với bệnh nhân mà thôi. Em nên tái khám tại chuyên
|
154 |
+
khoa Chấn thương Chỉnh hình để bác sĩ kiểm tra lại việc lành xương của em tốt
|
155 |
+
chưa và dặn em lịch trình rút đinh phù hợp, em nhé. Thân mến.'
|
156 |
+
- K dạ dày không điều trị tiên lượng sống khá ngắn Chào em, K dạ dày là ung thư
|
157 |
+
dạ dày. Bệnh ung thư dạ dày là bệnh lý ác tính và có chỉ định phẫu thuật cắt khối
|
158 |
+
u – cắt dạ dày khi còn có thể cắt được. Nếu đã phát hiện ung thư dạ dày mà không
|
159 |
+
điều trị phẫu thuật thì thời gian sống của bệnh nhân trung bình là 6 tháng đến
|
160 |
+
1 năm tùy loại ung thư dạ dày, khi ung thư tiến triển di căn có thể gây nhiều
|
161 |
+
đau đớn hơn. Hiện tại chị em đang bị suy nhược cơ thể nhiều, không ăn uống được,
|
162 |
+
đau nhiều do ung thư dạ dày là có chỉ định vào bệnh viện nằm điều trị luôn rồi,
|
163 |
+
chứ không thể nào lấy thuốc mà không tới phòng khám được đâu. Vô bệnh viện chị
|
164 |
+
em sẽ được truyền dịch, chích thuốc, nâng thể trạng lên rồi mới tính đến chuyện
|
165 |
+
điều trị khối ung thư kia. Em đưa chị em đến bệnh viện càng sớm càng tốt, tốt
|
166 |
+
nhất là bệnh viện Ung bướu, em nhé.
|
167 |
+
- source_sentence: "Thưa bác sĩ,\r\n\r\nEm bị đục thủy tinh thể do chấn thương và\
|
168 |
+
\ vừa mổ mắt về và em cũng bị cận thị. Thời gian khoảng 1 tuần em thấy mắt mình\
|
169 |
+
\ nhìn chỉ rõ hơn được 1 phần nào. Nhìn xa thì vẫn thấy nhưng vẫn mờ mờ. Bác sĩ\
|
170 |
+
\ cho em lời khuyên nên làm cách nào và mắt em có thể sáng lại như bình thường\
|
171 |
+
\ được không ạ?\r\n\r\nEm xin chân thành cảm ơn! (Minh Tiến - Bình Định)"
|
172 |
+
sentences:
|
173 |
+
- Bạn Minh Tiến thân mến, Hiện nay phẫu thuật đục thủy tinh thể đã được y học nói
|
174 |
+
chung và ngành Nhãn khoa Việt Nam thực hiện hoàn chỉnh đến mức tuyệt vời. Phẫu
|
175 |
+
thuật này được xem như một cuộc cách mạng rất đáng tự hào của ngành nhãn khoa.
|
176 |
+
Hàng ngày có thể tới hàng ngàn ca phẫu thuật đem lại ánh sáng cho người mù lòa
|
177 |
+
đục thể thủy tinh tại Việt Nam. Nói như vậy để giúp cho bạn hiểu rõ phẫu thuật
|
178 |
+
này các bác sĩ Việt Nam thực hiện rất thường xuyên và rất tốt. Tuy nhiên, với
|
179 |
+
mắt đục thủy tinh thể do chấn thương của bạn là ca phẫu thuật tương đối không
|
180 |
+
đơn giản. Thêm vào đó ngoài đục thủy tinh thể do chấn thương, mắt bạn cũng có
|
181 |
+
thể kèm theo tổn thương ở các bộ phận khác của mắt mà trước mổ bác sĩ khó có thể
|
182 |
+
chẩn đoán được. Với hai lý do nêu trên, nên đôi khi mắt mổ khó có thể tốt theo
|
183 |
+
ý muốn của cả bệnh nhân lẫn thầy thuốc. Bạn cần có thời gian theo dõi và điều
|
184 |
+
trị tiếp sau mổ. Sau thời gian ổn định khoảng 1 tháng, bạn cần đo thử kính xem
|
185 |
+
có cải thiện thị lực thêm không? Chúc bạn may mắn!
|
186 |
+
- Chào em, Bình thường các hạch trong cơ thể không sưng to lên đến mức có thể sờ
|
187 |
+
chạm hay nhận biết được. Vì thế, hạch sưng lên, hay thường gọi là nổi hạch, là
|
188 |
+
một triệu chứng bất thường của cơ thể. Cho nên, em lo lắng là đúng khi phát hiện
|
189 |
+
hạch ở vùng cổ. Hạch bạch huyết đóng vai trò quan trọng đối với hoạt động của
|
190 |
+
hệ miễn dịch. Chúng chứa các tế bào miễn dịch như lympho bào, đại thực bào...
|
191 |
+
có chức năng miễn dịch chống lại các yếu tố lạ như vi khuẩn, virus, kí sinh trùng...
|
192 |
+
xâm nhập vào cơ thể. Trong quá trình đó các hạch có thể bị viêm và sưng lên. Một
|
193 |
+
số trường hợp hạch sưng có thể là hạch ung thư hoặc di căn. Đặc điểm của hạch
|
194 |
+
viêm là nhỏ, số lượng ít, bờ tròn đều, không phát triển theo thời gian, không
|
195 |
+
xâm lấn da xung quanh. Thông thường đối với hạch viêm thì nguồn viêm có thể tấn
|
196 |
+
công tại hạch, cũng có khi là hạch viêm phản ứng với ổ viêm nhiễm cạnh đó, điều
|
197 |
+
trị hết viêm thì hạch sẽ lặn dần, có thể lặn chậm hơn vài tuần đến vài tháng,
|
198 |
+
có một số loại hạch cũng là hạch viêm nhưng mà chỉ giảm kích thước rồi cứ "lì"
|
199 |
+
vậy luôn - không lặn hẳn nhưng không còn sưng như trước và vẫn giữ hình ảnh của
|
200 |
+
hạch viêm, cũng có loại hạch viêm sau lại chuyển sang xơ chai hóa như sẹo cũ và
|
201 |
+
không lặn. Như vậy, em có 1 hạch vùng cổ đã được xác định là hạch viêm thông qua
|
202 |
+
sinh thiết hạch cách đây 10 năm. Trong vòng 10 năm nay, hạch cổ đó không có triệu
|
203 |
+
chứng bất thường. Gần đây, hạch cổ đó có biểu hiện viêm trở lại, mặc dù em uống
|
204 |
+
thuốc (tự mua) thì hạch hết sưng đau, nhưng em cũng cần khám lại bên chuyên khoa
|
205 |
+
ung bướu để kiểm tra tổng quát lại 1 lần, tìm nguyên nhân gây kích thích hạch
|
206 |
+
viêm này tái hoạt động, xem là nguyên nhân lành tính hay tiềm ẩn nguyên nhân khác
|
207 |
+
(vì lần kiểm tra trước đã cách đây 10 năm rồi), em nhé.
|
208 |
+
- ' Chào em, Trường hợp em mô tả là những bất thường của hệ hô hấp có thể là bệnh
|
209 |
+
lý tai mũi họng hay hô hấp dưới như viêm phổi, viêm phế quản, em cần đến các cơ
|
210 |
+
sở y tế chuyên sâu tai mũi họng hay hô hấp để khám thêm. Những biểu hiện đó hoàn
|
211 |
+
toàn không có cơ sở nghĩ . Thân mến!'
|
212 |
+
- source_sentence: Bác sĩ cho em hỏi, em bị rạn nứt xương gót chân bên phải. Em bị
|
213 |
+
hơn 1 tháng nay rồi. Em bỏ thuốc lá. Em muốn hỏi bác sĩ thông thường bó bột hơn
|
214 |
+
hay thuốc lá hơn? Như của em khoảng bao lâu thì khỏi? Và giờ em vẫn chưa đi được
|
215 |
+
bác sĩ ạ. Em cảm ơn.
|
216 |
+
sentences:
|
217 |
+
- 'Câu hỏi của em rất chân thành. Tự ý thức quyết tâm cai nghiệm là điều đáng quý.
|
218 |
+
Nếu em tiếp tục sử dụng thì tình trạng sẽ tồi tệ hơn rất nhiều. Ba yếu tố quan
|
219 |
+
trọng nhất và tiến hành đồng thời để cai nghiện thành công, đó là: 1. Ý chí 2.
|
220 |
+
Sự hiểu biết thấu đáo 3. Môi trường thân thiện. Các Trung tâm cai nghiện sẽ giúp
|
221 |
+
em phần 2 và phần 3, từ đó sẽ củng cố phần 1 của em. Trường hợp ở nhà mà em tự
|
222 |
+
cai, thực hành mỗi ngày với 3 điều kiện trên, em sẽ thành công như nhiều bạn khác.
|
223 |
+
Không nên nôn nóng, sốt ruột. Trước tiên em phải thuộc lòng và thực hành những
|
224 |
+
quy tắc này thành thói quen và áp dụng suốt đời. Nhiều trường hợp cai được vài
|
225 |
+
năm vẫn tái nghiện. Do đó, nên tránh xa những "nguồn" khiến em tái nghiện, tránh
|
226 |
+
xa bạn bè nghiện ngập em nhé. Chúc em quyết tâm và đem lại niềm vui cho bố mẹ.'
|
227 |
+
- Chào em, Thứ nhất, bắt buộc phải có phim Xquang để biết em có thực sự nứt xương
|
228 |
+
gót hay bị gãy phức tạp hơn, vì nhiều trường hợp tưởng chỉ nứt xương thôi nhưng
|
229 |
+
thật ra là vỡ phức tạp, phải phẫu thuật mới nhanh ổn được. Thứ hai, theo nguyên
|
230 |
+
tắc điều trị nứt gãy xương là phải cố định tốt để can xương mọc ra, chỗ nứt gãy
|
231 |
+
mới được nối liền. Do đó, nếu bó bột thì chân sẽ được cố định liên tục trong 4-6
|
232 |
+
tuần, còn bó lá thì phải thay thường xuyên, mỗi lần thay là 1 lần xê dịch nên
|
233 |
+
xương khó lành. Tốt hơn hết em nên đến Bệnh viện Chấn thương Chỉnh hình để được
|
234 |
+
kiểm tra và điều tr�� thích hợp, em nhé. Thân mến.
|
235 |
+
- Chào bạn, Qua hình ảnh sang thương và mô tả triệu chứng, bệnh lý của bạn có khả
|
236 |
+
năng là chàm hay còn gọi là viêm da dị ứng với đặc điểm là viêm và nổi mụn nhỏ,
|
237 |
+
ngứa ngáy. Nguyên nhân của chàm hiện nay chưa rõ nhưng có thể do cơ địa dị ứng
|
238 |
+
(người mắc hen, viêm mũi dị ứng có nguy cơ cao mắc chàm), do kích thích của hóa
|
239 |
+
chất như nước rửa chén, bột giặt, cao su, kim loại, chất liệu giày dép (chàm tiếp
|
240 |
+
xúc),... Thời tiết lạnh, stress, đổ mồ hôi nhiều và phấn hoa... cũng là những
|
241 |
+
nguyên nhân có thể khiến da bị chàm. Chàm cũng có thể gặp ở người bị suy van tĩnh
|
242 |
+
mạch, giãn tĩnh mạch chân khiến tình trạng bệnh dai dẳng, kém đáp ứng điều trị.
|
243 |
+
Điều trị chàm thường phải sử dụng một số loại thuốc bôi da kéo dài, có thể để
|
244 |
+
lại tác dụng phụ, do đó bạn nên khám BS Da liễu để kê toa loại thuốc phù hợp.
|
245 |
+
Ngoài ra, bạn nên chú ý xem có yếu tố nào thường kích thích khởi phát chàm để
|
246 |
+
tránh cho bệnh tái phát bạn nhé! Thân mến.
|
247 |
+
model-index:
|
248 |
+
- name: SentenceTransformer based on intfloat/multilingual-e5-base
|
249 |
+
results:
|
250 |
+
- task:
|
251 |
+
type: information-retrieval
|
252 |
+
name: Information Retrieval
|
253 |
+
dataset:
|
254 |
+
name: Unknown
|
255 |
+
type: unknown
|
256 |
+
metrics:
|
257 |
+
- type: cosine_accuracy@1
|
258 |
+
value: 0.741599707815924
|
259 |
+
name: Cosine Accuracy@1
|
260 |
+
- type: cosine_accuracy@3
|
261 |
+
value: 0.8559167275383491
|
262 |
+
name: Cosine Accuracy@3
|
263 |
+
- type: cosine_accuracy@5
|
264 |
+
value: 0.8966398831263697
|
265 |
+
name: Cosine Accuracy@5
|
266 |
+
- type: cosine_accuracy@10
|
267 |
+
value: 0.9340759678597517
|
268 |
+
name: Cosine Accuracy@10
|
269 |
+
- type: cosine_precision@1
|
270 |
+
value: 0.741599707815924
|
271 |
+
name: Cosine Precision@1
|
272 |
+
- type: cosine_precision@3
|
273 |
+
value: 0.28530557584611643
|
274 |
+
name: Cosine Precision@3
|
275 |
+
- type: cosine_precision@5
|
276 |
+
value: 0.1793279766252739
|
277 |
+
name: Cosine Precision@5
|
278 |
+
- type: cosine_precision@10
|
279 |
+
value: 0.09340759678597516
|
280 |
+
name: Cosine Precision@10
|
281 |
+
- type: cosine_recall@1
|
282 |
+
value: 0.741599707815924
|
283 |
+
name: Cosine Recall@1
|
284 |
+
- type: cosine_recall@3
|
285 |
+
value: 0.8559167275383491
|
286 |
+
name: Cosine Recall@3
|
287 |
+
- type: cosine_recall@5
|
288 |
+
value: 0.8966398831263697
|
289 |
+
name: Cosine Recall@5
|
290 |
+
- type: cosine_recall@10
|
291 |
+
value: 0.9340759678597517
|
292 |
+
name: Cosine Recall@10
|
293 |
+
- type: cosine_ndcg@10
|
294 |
+
value: 0.8384477179645746
|
295 |
+
name: Cosine Ndcg@10
|
296 |
+
- type: cosine_mrr@10
|
297 |
+
value: 0.8077062100710742
|
298 |
+
name: Cosine Mrr@10
|
299 |
+
- type: cosine_map@100
|
300 |
+
value: 0.8106736050755435
|
301 |
+
name: Cosine Map@100
|
302 |
+
- type: dot_accuracy@1
|
303 |
+
value: 0.741599707815924
|
304 |
+
name: Dot Accuracy@1
|
305 |
+
- type: dot_accuracy@3
|
306 |
+
value: 0.8559167275383491
|
307 |
+
name: Dot Accuracy@3
|
308 |
+
- type: dot_accuracy@5
|
309 |
+
value: 0.8966398831263697
|
310 |
+
name: Dot Accuracy@5
|
311 |
+
- type: dot_accuracy@10
|
312 |
+
value: 0.9340759678597517
|
313 |
+
name: Dot Accuracy@10
|
314 |
+
- type: dot_precision@1
|
315 |
+
value: 0.741599707815924
|
316 |
+
name: Dot Precision@1
|
317 |
+
- type: dot_precision@3
|
318 |
+
value: 0.28530557584611643
|
319 |
+
name: Dot Precision@3
|
320 |
+
- type: dot_precision@5
|
321 |
+
value: 0.1793279766252739
|
322 |
+
name: Dot Precision@5
|
323 |
+
- type: dot_precision@10
|
324 |
+
value: 0.09340759678597516
|
325 |
+
name: Dot Precision@10
|
326 |
+
- type: dot_recall@1
|
327 |
+
value: 0.741599707815924
|
328 |
+
name: Dot Recall@1
|
329 |
+
- type: dot_recall@3
|
330 |
+
value: 0.8559167275383491
|
331 |
+
name: Dot Recall@3
|
332 |
+
- type: dot_recall@5
|
333 |
+
value: 0.8966398831263697
|
334 |
+
name: Dot Recall@5
|
335 |
+
- type: dot_recall@10
|
336 |
+
value: 0.9340759678597517
|
337 |
+
name: Dot Recall@10
|
338 |
+
- type: dot_ndcg@10
|
339 |
+
value: 0.8384477179645746
|
340 |
+
name: Dot Ndcg@10
|
341 |
+
- type: dot_mrr@10
|
342 |
+
value: 0.8077062100710742
|
343 |
+
name: Dot Mrr@10
|
344 |
+
- type: dot_map@100
|
345 |
+
value: 0.8106736050755435
|
346 |
+
name: Dot Map@100
|
347 |
+
---
|
348 |
+
|
349 |
+
# SentenceTransformer based on intfloat/multilingual-e5-base
|
350 |
+
|
351 |
+
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [intfloat/multilingual-e5-base](https://huggingface.co/intfloat/multilingual-e5-base). It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
|
352 |
+
|
353 |
+
## Model Details
|
354 |
+
|
355 |
+
### Model Description
|
356 |
+
- **Model Type:** Sentence Transformer
|
357 |
+
- **Base model:** [intfloat/multilingual-e5-base](https://huggingface.co/intfloat/multilingual-e5-base) <!-- at revision d13f1b27baf31030b7fd040960d60d909913633f -->
|
358 |
+
- **Maximum Sequence Length:** 512 tokens
|
359 |
+
- **Output Dimensionality:** 768 tokens
|
360 |
+
- **Similarity Function:** Cosine Similarity
|
361 |
+
<!-- - **Training Dataset:** Unknown -->
|
362 |
+
<!-- - **Language:** Unknown -->
|
363 |
+
<!-- - **License:** Unknown -->
|
364 |
+
|
365 |
+
### Model Sources
|
366 |
+
|
367 |
+
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
|
368 |
+
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
|
369 |
+
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
|
370 |
+
|
371 |
+
### Full Model Architecture
|
372 |
+
|
373 |
+
```
|
374 |
+
SentenceTransformer(
|
375 |
+
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
|
376 |
+
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
|
377 |
+
(2): Normalize()
|
378 |
+
)
|
379 |
+
```
|
380 |
+
|
381 |
+
## Usage
|
382 |
+
|
383 |
+
### Direct Usage (Sentence Transformers)
|
384 |
+
|
385 |
+
First install the Sentence Transformers library:
|
386 |
+
|
387 |
+
```bash
|
388 |
+
pip install -U sentence-transformers
|
389 |
+
```
|
390 |
+
|
391 |
+
Then you can load this model and run inference.
|
392 |
+
```python
|
393 |
+
from sentence_transformers import SentenceTransformer
|
394 |
+
|
395 |
+
# Download from the 🤗 Hub
|
396 |
+
model = SentenceTransformer("meandyou200175/e5_large_finetune_16neg")
|
397 |
+
# Run inference
|
398 |
+
sentences = [
|
399 |
+
'Bác sĩ cho em hỏi, em bị rạn nứt xương gót chân bên phải. Em bị hơn 1 tháng nay rồi. Em bỏ thuốc lá. Em muốn hỏi bác sĩ thông thường bó bột hơn hay thuốc lá hơn? Như của em khoảng bao lâu thì khỏi? Và giờ em vẫn chưa đi được bác sĩ ạ. Em cảm ơn.',
|
400 |
+
'Chào em, Thứ nhất, bắt buộc phải có phim Xquang để biết em có thực sự nứt xương gót hay bị gãy phức tạp hơn, vì nhiều trường hợp tưởng chỉ nứt xương thôi nhưng thật ra là vỡ phức tạp, phải phẫu thuật mới nhanh ổn được. Thứ hai, theo nguyên tắc điều trị nứt gãy xương là phải cố định tốt để can xương mọc ra, chỗ nứt gãy mới được nối liền. Do đó, nếu bó bột thì chân sẽ được cố định liên tục trong 4-6 tuần, còn bó lá thì phải thay thường xuyên, mỗi lần thay là 1 lần xê dịch nên xương khó lành. Tốt hơn hết em nên đến Bệnh viện Chấn thương Chỉnh hình để được kiểm tra và điều trị thích hợp, em nhé. Thân mến.',
|
401 |
+
'Chào bạn, Qua hình ảnh sang thương và mô tả triệu chứng, bệnh lý của bạn có khả năng là chàm hay còn gọi là viêm da dị ứng với đặc điểm là viêm và nổi mụn nhỏ, ngứa ngáy. Nguyên nhân của chàm hiện nay chưa rõ nhưng có thể do cơ địa dị ứng (người mắc hen, viêm mũi dị ứng có nguy cơ cao mắc chàm), do kích thích của hóa chất như nước rửa chén, bột giặt, cao su, kim loại, chất liệu giày dép (chàm tiếp xúc),... Thời tiết lạnh, stress, đổ mồ hôi nhiều và phấn hoa... cũng là những nguyên nhân có thể khiến da bị chàm. Chàm cũng có thể gặp ở người bị suy van tĩnh mạch, giãn tĩnh mạch chân khiến tình trạng bệnh dai dẳng, kém đáp ứng điều trị. Điều trị chàm thường phải sử dụng một số loại thuốc bôi da kéo dài, có thể để lại tác dụng phụ, do đó bạn nên khám BS Da liễu để kê toa loại thuốc phù hợp. Ngoài ra, bạn nên chú ý xem có yếu tố nào thường kích thích khởi phát chàm để tránh cho bệnh tái phát bạn nhé! Thân mến.',
|
402 |
+
]
|
403 |
+
embeddings = model.encode(sentences)
|
404 |
+
print(embeddings.shape)
|
405 |
+
# [3, 768]
|
406 |
+
|
407 |
+
# Get the similarity scores for the embeddings
|
408 |
+
similarities = model.similarity(embeddings, embeddings)
|
409 |
+
print(similarities.shape)
|
410 |
+
# [3, 3]
|
411 |
+
```
|
412 |
+
|
413 |
+
<!--
|
414 |
+
### Direct Usage (Transformers)
|
415 |
+
|
416 |
+
<details><summary>Click to see the direct usage in Transformers</summary>
|
417 |
+
|
418 |
+
</details>
|
419 |
+
-->
|
420 |
+
|
421 |
+
<!--
|
422 |
+
### Downstream Usage (Sentence Transformers)
|
423 |
+
|
424 |
+
You can finetune this model on your own dataset.
|
425 |
+
|
426 |
+
<details><summary>Click to expand</summary>
|
427 |
+
|
428 |
+
</details>
|
429 |
+
-->
|
430 |
+
|
431 |
+
<!--
|
432 |
+
### Out-of-Scope Use
|
433 |
+
|
434 |
+
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
|
435 |
+
-->
|
436 |
+
|
437 |
+
## Evaluation
|
438 |
+
|
439 |
+
### Metrics
|
440 |
+
|
441 |
+
#### Information Retrieval
|
442 |
+
|
443 |
+
* Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
|
444 |
+
|
445 |
+
| Metric | Value |
|
446 |
+
|:--------------------|:-----------|
|
447 |
+
| cosine_accuracy@1 | 0.7416 |
|
448 |
+
| cosine_accuracy@3 | 0.8559 |
|
449 |
+
| cosine_accuracy@5 | 0.8966 |
|
450 |
+
| cosine_accuracy@10 | 0.9341 |
|
451 |
+
| cosine_precision@1 | 0.7416 |
|
452 |
+
| cosine_precision@3 | 0.2853 |
|
453 |
+
| cosine_precision@5 | 0.1793 |
|
454 |
+
| cosine_precision@10 | 0.0934 |
|
455 |
+
| cosine_recall@1 | 0.7416 |
|
456 |
+
| cosine_recall@3 | 0.8559 |
|
457 |
+
| cosine_recall@5 | 0.8966 |
|
458 |
+
| cosine_recall@10 | 0.9341 |
|
459 |
+
| cosine_ndcg@10 | 0.8384 |
|
460 |
+
| cosine_mrr@10 | 0.8077 |
|
461 |
+
| **cosine_map@100** | **0.8107** |
|
462 |
+
| dot_accuracy@1 | 0.7416 |
|
463 |
+
| dot_accuracy@3 | 0.8559 |
|
464 |
+
| dot_accuracy@5 | 0.8966 |
|
465 |
+
| dot_accuracy@10 | 0.9341 |
|
466 |
+
| dot_precision@1 | 0.7416 |
|
467 |
+
| dot_precision@3 | 0.2853 |
|
468 |
+
| dot_precision@5 | 0.1793 |
|
469 |
+
| dot_precision@10 | 0.0934 |
|
470 |
+
| dot_recall@1 | 0.7416 |
|
471 |
+
| dot_recall@3 | 0.8559 |
|
472 |
+
| dot_recall@5 | 0.8966 |
|
473 |
+
| dot_recall@10 | 0.9341 |
|
474 |
+
| dot_ndcg@10 | 0.8384 |
|
475 |
+
| dot_mrr@10 | 0.8077 |
|
476 |
+
| dot_map@100 | 0.8107 |
|
477 |
+
|
478 |
+
<!--
|
479 |
+
## Bias, Risks and Limitations
|
480 |
+
|
481 |
+
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
|
482 |
+
-->
|
483 |
+
|
484 |
+
<!--
|
485 |
+
### Recommendations
|
486 |
+
|
487 |
+
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
|
488 |
+
-->
|
489 |
+
|
490 |
+
## Training Details
|
491 |
+
|
492 |
+
### Training Hyperparameters
|
493 |
+
#### Non-Default Hyperparameters
|
494 |
+
|
495 |
+
- `eval_strategy`: steps
|
496 |
+
- `per_device_train_batch_size`: 2
|
497 |
+
- `per_device_eval_batch_size`: 2
|
498 |
+
- `learning_rate`: 2e-05
|
499 |
+
- `num_train_epochs`: 1
|
500 |
+
- `warmup_ratio`: 0.1
|
501 |
+
- `fp16`: True
|
502 |
+
- `batch_sampler`: no_duplicates
|
503 |
+
|
504 |
+
#### All Hyperparameters
|
505 |
+
<details><summary>Click to expand</summary>
|
506 |
+
|
507 |
+
- `overwrite_output_dir`: False
|
508 |
+
- `do_predict`: False
|
509 |
+
- `eval_strategy`: steps
|
510 |
+
- `prediction_loss_only`: True
|
511 |
+
- `per_device_train_batch_size`: 2
|
512 |
+
- `per_device_eval_batch_size`: 2
|
513 |
+
- `per_gpu_train_batch_size`: None
|
514 |
+
- `per_gpu_eval_batch_size`: None
|
515 |
+
- `gradient_accumulation_steps`: 1
|
516 |
+
- `eval_accumulation_steps`: None
|
517 |
+
- `torch_empty_cache_steps`: None
|
518 |
+
- `learning_rate`: 2e-05
|
519 |
+
- `weight_decay`: 0.0
|
520 |
+
- `adam_beta1`: 0.9
|
521 |
+
- `adam_beta2`: 0.999
|
522 |
+
- `adam_epsilon`: 1e-08
|
523 |
+
- `max_grad_norm`: 1.0
|
524 |
+
- `num_train_epochs`: 1
|
525 |
+
- `max_steps`: -1
|
526 |
+
- `lr_scheduler_type`: linear
|
527 |
+
- `lr_scheduler_kwargs`: {}
|
528 |
+
- `warmup_ratio`: 0.1
|
529 |
+
- `warmup_steps`: 0
|
530 |
+
- `log_level`: passive
|
531 |
+
- `log_level_replica`: warning
|
532 |
+
- `log_on_each_node`: True
|
533 |
+
- `logging_nan_inf_filter`: True
|
534 |
+
- `save_safetensors`: True
|
535 |
+
- `save_on_each_node`: False
|
536 |
+
- `save_only_model`: False
|
537 |
+
- `restore_callback_states_from_checkpoint`: False
|
538 |
+
- `no_cuda`: False
|
539 |
+
- `use_cpu`: False
|
540 |
+
- `use_mps_device`: False
|
541 |
+
- `seed`: 42
|
542 |
+
- `data_seed`: None
|
543 |
+
- `jit_mode_eval`: False
|
544 |
+
- `use_ipex`: False
|
545 |
+
- `bf16`: False
|
546 |
+
- `fp16`: True
|
547 |
+
- `fp16_opt_level`: O1
|
548 |
+
- `half_precision_backend`: auto
|
549 |
+
- `bf16_full_eval`: False
|
550 |
+
- `fp16_full_eval`: False
|
551 |
+
- `tf32`: None
|
552 |
+
- `local_rank`: 0
|
553 |
+
- `ddp_backend`: None
|
554 |
+
- `tpu_num_cores`: None
|
555 |
+
- `tpu_metrics_debug`: False
|
556 |
+
- `debug`: []
|
557 |
+
- `dataloader_drop_last`: False
|
558 |
+
- `dataloader_num_workers`: 0
|
559 |
+
- `dataloader_prefetch_factor`: None
|
560 |
+
- `past_index`: -1
|
561 |
+
- `disable_tqdm`: False
|
562 |
+
- `remove_unused_columns`: True
|
563 |
+
- `label_names`: None
|
564 |
+
- `load_best_model_at_end`: False
|
565 |
+
- `ignore_data_skip`: False
|
566 |
+
- `fsdp`: []
|
567 |
+
- `fsdp_min_num_params`: 0
|
568 |
+
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
|
569 |
+
- `fsdp_transformer_layer_cls_to_wrap`: None
|
570 |
+
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
|
571 |
+
- `deepspeed`: None
|
572 |
+
- `label_smoothing_factor`: 0.0
|
573 |
+
- `optim`: adamw_torch
|
574 |
+
- `optim_args`: None
|
575 |
+
- `adafactor`: False
|
576 |
+
- `group_by_length`: False
|
577 |
+
- `length_column_name`: length
|
578 |
+
- `ddp_find_unused_parameters`: None
|
579 |
+
- `ddp_bucket_cap_mb`: None
|
580 |
+
- `ddp_broadcast_buffers`: False
|
581 |
+
- `dataloader_pin_memory`: True
|
582 |
+
- `dataloader_persistent_workers`: False
|
583 |
+
- `skip_memory_metrics`: True
|
584 |
+
- `use_legacy_prediction_loop`: False
|
585 |
+
- `push_to_hub`: False
|
586 |
+
- `resume_from_checkpoint`: None
|
587 |
+
- `hub_model_id`: None
|
588 |
+
- `hub_strategy`: every_save
|
589 |
+
- `hub_private_repo`: False
|
590 |
+
- `hub_always_push`: False
|
591 |
+
- `gradient_checkpointing`: False
|
592 |
+
- `gradient_checkpointing_kwargs`: None
|
593 |
+
- `include_inputs_for_metrics`: False
|
594 |
+
- `eval_do_concat_batches`: True
|
595 |
+
- `fp16_backend`: auto
|
596 |
+
- `push_to_hub_model_id`: None
|
597 |
+
- `push_to_hub_organization`: None
|
598 |
+
- `mp_parameters`:
|
599 |
+
- `auto_find_batch_size`: False
|
600 |
+
- `full_determinism`: False
|
601 |
+
- `torchdynamo`: None
|
602 |
+
- `ray_scope`: last
|
603 |
+
- `ddp_timeout`: 1800
|
604 |
+
- `torch_compile`: False
|
605 |
+
- `torch_compile_backend`: None
|
606 |
+
- `torch_compile_mode`: None
|
607 |
+
- `dispatch_batches`: None
|
608 |
+
- `split_batches`: None
|
609 |
+
- `include_tokens_per_second`: False
|
610 |
+
- `include_num_input_tokens_seen`: False
|
611 |
+
- `neftune_noise_alpha`: None
|
612 |
+
- `optim_target_modules`: None
|
613 |
+
- `batch_eval_metrics`: False
|
614 |
+
- `eval_on_start`: False
|
615 |
+
- `use_liger_kernel`: False
|
616 |
+
- `eval_use_gather_object`: False
|
617 |
+
- `batch_sampler`: no_duplicates
|
618 |
+
- `multi_dataset_batch_sampler`: proportional
|
619 |
+
|
620 |
+
</details>
|
621 |
+
|
622 |
+
### Training Logs
|
623 |
+
<details><summary>Click to expand</summary>
|
624 |
+
|
625 |
+
| Epoch | Step | Training Loss | Validation Loss | cosine_map@100 |
|
626 |
+
|:------:|:-----:|:-------------:|:---------------:|:--------------:|
|
627 |
+
| 0 | 0 | - | - | 0.7050 |
|
628 |
+
| 0.0046 | 100 | 2.2456 | - | - |
|
629 |
+
| 0.0091 | 200 | 1.4036 | - | - |
|
630 |
+
| 0.0137 | 300 | 0.4733 | - | - |
|
631 |
+
| 0.0183 | 400 | 0.2427 | - | - |
|
632 |
+
| 0.0228 | 500 | 0.2094 | - | - |
|
633 |
+
| 0.0274 | 600 | 0.1579 | - | - |
|
634 |
+
| 0.0320 | 700 | 0.147 | - | - |
|
635 |
+
| 0.0365 | 800 | 0.1843 | - | - |
|
636 |
+
| 0.0411 | 900 | 0.1713 | - | - |
|
637 |
+
| 0.0457 | 1000 | 0.2074 | 0.0182 | 0.7295 |
|
638 |
+
| 0.0502 | 1100 | 0.1834 | - | - |
|
639 |
+
| 0.0548 | 1200 | 0.1873 | - | - |
|
640 |
+
| 0.0594 | 1300 | 0.1078 | - | - |
|
641 |
+
| 0.0639 | 1400 | 0.158 | - | - |
|
642 |
+
| 0.0685 | 1500 | 0.0976 | - | - |
|
643 |
+
| 0.0731 | 1600 | 0.1475 | - | - |
|
644 |
+
| 0.0776 | 1700 | 0.1735 | - | - |
|
645 |
+
| 0.0822 | 1800 | 0.1233 | - | - |
|
646 |
+
| 0.0868 | 1900 | 0.113 | - | - |
|
647 |
+
| 0.0913 | 2000 | 0.2061 | 0.0174 | 0.7392 |
|
648 |
+
| 0.0959 | 2100 | 0.1681 | - | - |
|
649 |
+
| 0.1004 | 2200 | 0.1315 | - | - |
|
650 |
+
| 0.1050 | 2300 | 0.1805 | - | - |
|
651 |
+
| 0.1096 | 2400 | 0.1659 | - | - |
|
652 |
+
| 0.1141 | 2500 | 0.1142 | - | - |
|
653 |
+
| 0.1187 | 2600 | 0.1001 | - | - |
|
654 |
+
| 0.1233 | 2700 | 0.141 | - | - |
|
655 |
+
| 0.1278 | 2800 | 0.2741 | - | - |
|
656 |
+
| 0.1324 | 2900 | 0.1212 | - | - |
|
657 |
+
| 0.1370 | 3000 | 0.1081 | 0.0214 | 0.7236 |
|
658 |
+
| 0.1415 | 3100 | 0.1535 | - | - |
|
659 |
+
| 0.1461 | 3200 | 0.1588 | - | - |
|
660 |
+
| 0.1507 | 3300 | 0.1734 | - | - |
|
661 |
+
| 0.1552 | 3400 | 0.1239 | - | - |
|
662 |
+
| 0.1598 | 3500 | 0.1515 | - | - |
|
663 |
+
| 0.1644 | 3600 | 0.1923 | - | - |
|
664 |
+
| 0.1689 | 3700 | 0.2158 | - | - |
|
665 |
+
| 0.1735 | 3800 | 0.1589 | - | - |
|
666 |
+
| 0.1781 | 3900 | 0.1333 | - | - |
|
667 |
+
| 0.1826 | 4000 | 0.1567 | 0.0193 | 0.7444 |
|
668 |
+
| 0.1872 | 4100 | 0.128 | - | - |
|
669 |
+
| 0.1918 | 4200 | 0.1909 | - | - |
|
670 |
+
| 0.1963 | 4300 | 0.0948 | - | - |
|
671 |
+
| 0.2009 | 4400 | 0.1284 | - | - |
|
672 |
+
| 0.2055 | 4500 | 0.1101 | - | - |
|
673 |
+
| 0.2100 | 4600 | 0.1342 | - | - |
|
674 |
+
| 0.2146 | 4700 | 0.1431 | - | - |
|
675 |
+
| 0.2192 | 4800 | 0.1779 | - | - |
|
676 |
+
| 0.2237 | 4900 | 0.1926 | - | - |
|
677 |
+
| 0.2283 | 5000 | 0.1413 | 0.0216 | 0.7233 |
|
678 |
+
| 0.2329 | 5100 | 0.163 | - | - |
|
679 |
+
| 0.2374 | 5200 | 0.1309 | - | - |
|
680 |
+
| 0.2420 | 5300 | 0.1381 | - | - |
|
681 |
+
| 0.2466 | 5400 | 0.1975 | - | - |
|
682 |
+
| 0.2511 | 5500 | 0.0921 | - | - |
|
683 |
+
| 0.2557 | 5600 | 0.1378 | - | - |
|
684 |
+
| 0.2603 | 5700 | 0.17 | - | - |
|
685 |
+
| 0.2648 | 5800 | 0.1614 | - | - |
|
686 |
+
| 0.2694 | 5900 | 0.116 | - | - |
|
687 |
+
| 0.2739 | 6000 | 0.206 | 0.0177 | 0.7437 |
|
688 |
+
| 0.2785 | 6100 | 0.1592 | - | - |
|
689 |
+
| 0.2831 | 6200 | 0.102 | - | - |
|
690 |
+
| 0.2876 | 6300 | 0.148 | - | - |
|
691 |
+
| 0.2922 | 6400 | 0.1497 | - | - |
|
692 |
+
| 0.2968 | 6500 | 0.1532 | - | - |
|
693 |
+
| 0.3013 | 6600 | 0.1342 | - | - |
|
694 |
+
| 0.3059 | 6700 | 0.1463 | - | - |
|
695 |
+
| 0.3105 | 6800 | 0.1617 | - | - |
|
696 |
+
| 0.3150 | 6900 | 0.1384 | - | - |
|
697 |
+
| 0.3196 | 7000 | 0.0824 | 0.0143 | 0.7508 |
|
698 |
+
| 0.3242 | 7100 | 0.1129 | - | - |
|
699 |
+
| 0.3287 | 7200 | 0.1192 | - | - |
|
700 |
+
| 0.3333 | 7300 | 0.1283 | - | - |
|
701 |
+
| 0.3379 | 7400 | 0.1421 | - | - |
|
702 |
+
| 0.3424 | 7500 | 0.0784 | - | - |
|
703 |
+
| 0.3470 | 7600 | 0.1096 | - | - |
|
704 |
+
| 0.3516 | 7700 | 0.0684 | - | - |
|
705 |
+
| 0.3561 | 7800 | 0.0849 | - | - |
|
706 |
+
| 0.3607 | 7900 | 0.1183 | - | - |
|
707 |
+
| 0.3653 | 8000 | 0.0873 | 0.0101 | 0.7599 |
|
708 |
+
| 0.3698 | 8100 | 0.1331 | - | - |
|
709 |
+
| 0.3744 | 8200 | 0.0238 | - | - |
|
710 |
+
| 0.3790 | 8300 | 0.1123 | - | - |
|
711 |
+
| 0.3835 | 8400 | 0.0816 | - | - |
|
712 |
+
| 0.3881 | 8500 | 0.1117 | - | - |
|
713 |
+
| 0.3927 | 8600 | 0.2178 | - | - |
|
714 |
+
| 0.3972 | 8700 | 0.0752 | - | - |
|
715 |
+
| 0.4018 | 8800 | 0.1138 | - | - |
|
716 |
+
| 0.4064 | 8900 | 0.1039 | - | - |
|
717 |
+
| 0.4109 | 9000 | 0.119 | 0.0125 | 0.7596 |
|
718 |
+
| 0.4155 | 9100 | 0.1164 | - | - |
|
719 |
+
| 0.4201 | 9200 | 0.1008 | - | - |
|
720 |
+
| 0.4246 | 9300 | 0.1605 | - | - |
|
721 |
+
| 0.4292 | 9400 | 0.1103 | - | - |
|
722 |
+
| 0.4338 | 9500 | 0.0518 | - | - |
|
723 |
+
| 0.4383 | 9600 | 0.1239 | - | - |
|
724 |
+
| 0.4429 | 9700 | 0.1076 | - | - |
|
725 |
+
| 0.4474 | 9800 | 0.077 | - | - |
|
726 |
+
| 0.4520 | 9900 | 0.0753 | - | - |
|
727 |
+
| 0.4566 | 10000 | 0.1535 | 0.0113 | 0.7597 |
|
728 |
+
| 0.4611 | 10100 | 0.136 | - | - |
|
729 |
+
| 0.4657 | 10200 | 0.164 | - | - |
|
730 |
+
| 0.4703 | 10300 | 0.0494 | - | - |
|
731 |
+
| 0.4748 | 10400 | 0.1561 | - | - |
|
732 |
+
| 0.4794 | 10500 | 0.0658 | - | - |
|
733 |
+
| 0.4840 | 10600 | 0.0464 | - | - |
|
734 |
+
| 0.4885 | 10700 | 0.0794 | - | - |
|
735 |
+
| 0.4931 | 10800 | 0.1572 | - | - |
|
736 |
+
| 0.4977 | 10900 | 0.0902 | - | - |
|
737 |
+
| 0.5022 | 11000 | 0.0808 | 0.0104 | 0.7770 |
|
738 |
+
| 0.5068 | 11100 | 0.0452 | - | - |
|
739 |
+
| 0.5114 | 11200 | 0.0555 | - | - |
|
740 |
+
| 0.5159 | 11300 | 0.0754 | - | - |
|
741 |
+
| 0.5205 | 11400 | 0.122 | - | - |
|
742 |
+
| 0.5251 | 11500 | 0.1165 | - | - |
|
743 |
+
| 0.5296 | 11600 | 0.1068 | - | - |
|
744 |
+
| 0.5342 | 11700 | 0.0813 | - | - |
|
745 |
+
| 0.5388 | 11800 | 0.1062 | - | - |
|
746 |
+
| 0.5433 | 11900 | 0.1105 | - | - |
|
747 |
+
| 0.5479 | 12000 | 0.1126 | 0.0104 | 0.7788 |
|
748 |
+
| 0.5525 | 12100 | 0.0947 | - | - |
|
749 |
+
| 0.5570 | 12200 | 0.0803 | - | - |
|
750 |
+
| 0.5616 | 12300 | 0.0945 | - | - |
|
751 |
+
| 0.5662 | 12400 | 0.1576 | - | - |
|
752 |
+
| 0.5707 | 12500 | 0.0798 | - | - |
|
753 |
+
| 0.5753 | 12600 | 0.0743 | - | - |
|
754 |
+
| 0.5799 | 12700 | 0.0441 | - | - |
|
755 |
+
| 0.5844 | 12800 | 0.0529 | - | - |
|
756 |
+
| 0.5890 | 12900 | 0.0562 | - | - |
|
757 |
+
| 0.5936 | 13000 | 0.046 | 0.0100 | 0.7845 |
|
758 |
+
| 0.5981 | 13100 | 0.0735 | - | - |
|
759 |
+
| 0.6027 | 13200 | 0.1007 | - | - |
|
760 |
+
| 0.6073 | 13300 | 0.1 | - | - |
|
761 |
+
| 0.6118 | 13400 | 0.0784 | - | - |
|
762 |
+
| 0.6164 | 13500 | 0.0663 | - | - |
|
763 |
+
| 0.6209 | 13600 | 0.0446 | - | - |
|
764 |
+
| 0.6255 | 13700 | 0.1207 | - | - |
|
765 |
+
| 0.6301 | 13800 | 0.1348 | - | - |
|
766 |
+
| 0.6346 | 13900 | 0.0741 | - | - |
|
767 |
+
| 0.6392 | 14000 | 0.0535 | 0.0088 | 0.7948 |
|
768 |
+
| 0.6438 | 14100 | 0.1341 | - | - |
|
769 |
+
| 0.6483 | 14200 | 0.0866 | - | - |
|
770 |
+
| 0.6529 | 14300 | 0.1242 | - | - |
|
771 |
+
| 0.6575 | 14400 | 0.0314 | - | - |
|
772 |
+
| 0.6620 | 14500 | 0.0682 | - | - |
|
773 |
+
| 0.6666 | 14600 | 0.1194 | - | - |
|
774 |
+
| 0.6712 | 14700 | 0.0723 | - | - |
|
775 |
+
| 0.6757 | 14800 | 0.1074 | - | - |
|
776 |
+
| 0.6803 | 14900 | 0.0737 | - | - |
|
777 |
+
| 0.6849 | 15000 | 0.1153 | 0.0081 | 0.7988 |
|
778 |
+
| 0.6894 | 15100 | 0.0791 | - | - |
|
779 |
+
| 0.6940 | 15200 | 0.072 | - | - |
|
780 |
+
| 0.6986 | 15300 | 0.0453 | - | - |
|
781 |
+
| 0.7031 | 15400 | 0.1049 | - | - |
|
782 |
+
| 0.7077 | 15500 | 0.0948 | - | - |
|
783 |
+
| 0.7123 | 15600 | 0.0588 | - | - |
|
784 |
+
| 0.7168 | 15700 | 0.0733 | - | - |
|
785 |
+
| 0.7214 | 15800 | 0.071 | - | - |
|
786 |
+
| 0.7260 | 15900 | 0.0485 | - | - |
|
787 |
+
| 0.7305 | 16000 | 0.1058 | 0.0083 | 0.7949 |
|
788 |
+
| 0.7351 | 16100 | 0.0568 | - | - |
|
789 |
+
| 0.7397 | 16200 | 0.1078 | - | - |
|
790 |
+
| 0.7442 | 16300 | 0.0616 | - | - |
|
791 |
+
| 0.7488 | 16400 | 0.0693 | - | - |
|
792 |
+
| 0.7534 | 16500 | 0.101 | - | - |
|
793 |
+
| 0.7579 | 16600 | 0.05 | - | - |
|
794 |
+
| 0.7625 | 16700 | 0.0707 | - | - |
|
795 |
+
| 0.7671 | 16800 | 0.1209 | - | - |
|
796 |
+
| 0.7716 | 16900 | 0.0474 | - | - |
|
797 |
+
| 0.7762 | 17000 | 0.0418 | 0.0090 | 0.7955 |
|
798 |
+
| 0.7808 | 17100 | 0.0636 | - | - |
|
799 |
+
| 0.7853 | 17200 | 0.1196 | - | - |
|
800 |
+
| 0.7899 | 17300 | 0.1044 | - | - |
|
801 |
+
| 0.7944 | 17400 | 0.0641 | - | - |
|
802 |
+
| 0.7990 | 17500 | 0.0582 | - | - |
|
803 |
+
| 0.8036 | 17600 | 0.0582 | - | - |
|
804 |
+
| 0.8081 | 17700 | 0.048 | - | - |
|
805 |
+
| 0.8127 | 17800 | 0.0612 | - | - |
|
806 |
+
| 0.8173 | 17900 | 0.023 | - | - |
|
807 |
+
| 0.8218 | 18000 | 0.0586 | 0.0088 | 0.7990 |
|
808 |
+
| 0.8264 | 18100 | 0.0874 | - | - |
|
809 |
+
| 0.8310 | 18200 | 0.0544 | - | - |
|
810 |
+
| 0.8355 | 18300 | 0.0764 | - | - |
|
811 |
+
| 0.8401 | 18400 | 0.0342 | - | - |
|
812 |
+
| 0.8447 | 18500 | 0.0507 | - | - |
|
813 |
+
| 0.8492 | 18600 | 0.0586 | - | - |
|
814 |
+
| 0.8538 | 18700 | 0.059 | - | - |
|
815 |
+
| 0.8584 | 18800 | 0.074 | - | - |
|
816 |
+
| 0.8629 | 18900 | 0.0579 | - | - |
|
817 |
+
| 0.8675 | 19000 | 0.0515 | 0.0081 | 0.8050 |
|
818 |
+
| 0.8721 | 19100 | 0.0799 | - | - |
|
819 |
+
| 0.8766 | 19200 | 0.0267 | - | - |
|
820 |
+
| 0.8812 | 19300 | 0.0721 | - | - |
|
821 |
+
| 0.8858 | 19400 | 0.0539 | - | - |
|
822 |
+
| 0.8903 | 19500 | 0.0279 | - | - |
|
823 |
+
| 0.8949 | 19600 | 0.0777 | - | - |
|
824 |
+
| 0.8995 | 19700 | 0.0446 | - | - |
|
825 |
+
| 0.9040 | 19800 | 0.0463 | - | - |
|
826 |
+
| 0.9086 | 19900 | 0.1307 | - | - |
|
827 |
+
| 0.9132 | 20000 | 0.0858 | 0.0077 | 0.8088 |
|
828 |
+
| 0.9177 | 20100 | 0.0789 | - | - |
|
829 |
+
| 0.9223 | 20200 | 0.0582 | - | - |
|
830 |
+
| 0.9269 | 20300 | 0.0916 | - | - |
|
831 |
+
| 0.9314 | 20400 | 0.0698 | - | - |
|
832 |
+
| 0.9360 | 20500 | 0.059 | - | - |
|
833 |
+
| 0.9406 | 20600 | 0.0616 | - | - |
|
834 |
+
| 0.9451 | 20700 | 0.1104 | - | - |
|
835 |
+
| 0.9497 | 20800 | 0.0268 | - | - |
|
836 |
+
| 0.9543 | 20900 | 0.0397 | - | - |
|
837 |
+
| 0.9588 | 21000 | 0.0473 | 0.0075 | 0.8107 |
|
838 |
+
| 0.9634 | 21100 | 0.0697 | - | - |
|
839 |
+
| 0.9679 | 21200 | 0.0889 | - | - |
|
840 |
+
| 0.9725 | 21300 | 0.042 | - | - |
|
841 |
+
| 0.9771 | 21400 | 0.0359 | - | - |
|
842 |
+
| 0.9816 | 21500 | 0.0995 | - | - |
|
843 |
+
| 0.9862 | 21600 | 0.0745 | - | - |
|
844 |
+
| 0.9908 | 21700 | 0.0492 | - | - |
|
845 |
+
| 0.9953 | 21800 | 0.0597 | - | - |
|
846 |
+
| 0.9999 | 21900 | 0.0113 | - | - |
|
847 |
+
|
848 |
+
</details>
|
849 |
+
|
850 |
+
### Framework Versions
|
851 |
+
- Python: 3.10.14
|
852 |
+
- Sentence Transformers: 3.2.1
|
853 |
+
- Transformers: 4.45.1
|
854 |
+
- PyTorch: 2.4.0
|
855 |
+
- Accelerate: 0.34.2
|
856 |
+
- Datasets: 3.0.1
|
857 |
+
- Tokenizers: 0.20.0
|
858 |
+
|
859 |
+
## Citation
|
860 |
+
|
861 |
+
### BibTeX
|
862 |
+
|
863 |
+
#### Sentence Transformers
|
864 |
+
```bibtex
|
865 |
+
@inproceedings{reimers-2019-sentence-bert,
|
866 |
+
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
|
867 |
+
author = "Reimers, Nils and Gurevych, Iryna",
|
868 |
+
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
|
869 |
+
month = "11",
|
870 |
+
year = "2019",
|
871 |
+
publisher = "Association for Computational Linguistics",
|
872 |
+
url = "https://arxiv.org/abs/1908.10084",
|
873 |
+
}
|
874 |
+
```
|
875 |
+
|
876 |
+
#### MultipleNegativesRankingLoss
|
877 |
+
```bibtex
|
878 |
+
@misc{henderson2017efficient,
|
879 |
+
title={Efficient Natural Language Response Suggestion for Smart Reply},
|
880 |
+
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
|
881 |
+
year={2017},
|
882 |
+
eprint={1705.00652},
|
883 |
+
archivePrefix={arXiv},
|
884 |
+
primaryClass={cs.CL}
|
885 |
+
}
|
886 |
+
```
|
887 |
+
|
888 |
+
<!--
|
889 |
+
## Glossary
|
890 |
+
|
891 |
+
*Clearly define terms in order to be accessible across audiences.*
|
892 |
+
-->
|
893 |
+
|
894 |
+
<!--
|
895 |
+
## Model Card Authors
|
896 |
+
|
897 |
+
*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
|
898 |
+
-->
|
899 |
+
|
900 |
+
<!--
|
901 |
+
## Model Card Contact
|
902 |
+
|
903 |
+
*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
|
904 |
+
-->
|
config.json
ADDED
@@ -0,0 +1,28 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"_name_or_path": "intfloat/multilingual-e5-base",
|
3 |
+
"architectures": [
|
4 |
+
"XLMRobertaModel"
|
5 |
+
],
|
6 |
+
"attention_probs_dropout_prob": 0.1,
|
7 |
+
"bos_token_id": 0,
|
8 |
+
"classifier_dropout": null,
|
9 |
+
"eos_token_id": 2,
|
10 |
+
"hidden_act": "gelu",
|
11 |
+
"hidden_dropout_prob": 0.1,
|
12 |
+
"hidden_size": 768,
|
13 |
+
"initializer_range": 0.02,
|
14 |
+
"intermediate_size": 3072,
|
15 |
+
"layer_norm_eps": 1e-05,
|
16 |
+
"max_position_embeddings": 514,
|
17 |
+
"model_type": "xlm-roberta",
|
18 |
+
"num_attention_heads": 12,
|
19 |
+
"num_hidden_layers": 12,
|
20 |
+
"output_past": true,
|
21 |
+
"pad_token_id": 1,
|
22 |
+
"position_embedding_type": "absolute",
|
23 |
+
"torch_dtype": "float32",
|
24 |
+
"transformers_version": "4.45.1",
|
25 |
+
"type_vocab_size": 1,
|
26 |
+
"use_cache": true,
|
27 |
+
"vocab_size": 250002
|
28 |
+
}
|
config_sentence_transformers.json
ADDED
@@ -0,0 +1,10 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"__version__": {
|
3 |
+
"sentence_transformers": "3.2.1",
|
4 |
+
"transformers": "4.45.1",
|
5 |
+
"pytorch": "2.4.0"
|
6 |
+
},
|
7 |
+
"prompts": {},
|
8 |
+
"default_prompt_name": null,
|
9 |
+
"similarity_fn_name": null
|
10 |
+
}
|
model.safetensors
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:360ded5f1d1a2eb11fca8be4436d3692100ab5308fb8e027e014155aa90e4b21
|
3 |
+
size 1112197096
|
modules.json
ADDED
@@ -0,0 +1,20 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
[
|
2 |
+
{
|
3 |
+
"idx": 0,
|
4 |
+
"name": "0",
|
5 |
+
"path": "",
|
6 |
+
"type": "sentence_transformers.models.Transformer"
|
7 |
+
},
|
8 |
+
{
|
9 |
+
"idx": 1,
|
10 |
+
"name": "1",
|
11 |
+
"path": "1_Pooling",
|
12 |
+
"type": "sentence_transformers.models.Pooling"
|
13 |
+
},
|
14 |
+
{
|
15 |
+
"idx": 2,
|
16 |
+
"name": "2",
|
17 |
+
"path": "2_Normalize",
|
18 |
+
"type": "sentence_transformers.models.Normalize"
|
19 |
+
}
|
20 |
+
]
|
sentence_bert_config.json
ADDED
@@ -0,0 +1,4 @@
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"max_seq_length": 512,
|
3 |
+
"do_lower_case": false
|
4 |
+
}
|
sentencepiece.bpe.model
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
|
3 |
+
size 5069051
|
special_tokens_map.json
ADDED
@@ -0,0 +1,51 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"bos_token": {
|
3 |
+
"content": "<s>",
|
4 |
+
"lstrip": false,
|
5 |
+
"normalized": false,
|
6 |
+
"rstrip": false,
|
7 |
+
"single_word": false
|
8 |
+
},
|
9 |
+
"cls_token": {
|
10 |
+
"content": "<s>",
|
11 |
+
"lstrip": false,
|
12 |
+
"normalized": false,
|
13 |
+
"rstrip": false,
|
14 |
+
"single_word": false
|
15 |
+
},
|
16 |
+
"eos_token": {
|
17 |
+
"content": "</s>",
|
18 |
+
"lstrip": false,
|
19 |
+
"normalized": false,
|
20 |
+
"rstrip": false,
|
21 |
+
"single_word": false
|
22 |
+
},
|
23 |
+
"mask_token": {
|
24 |
+
"content": "<mask>",
|
25 |
+
"lstrip": true,
|
26 |
+
"normalized": false,
|
27 |
+
"rstrip": false,
|
28 |
+
"single_word": false
|
29 |
+
},
|
30 |
+
"pad_token": {
|
31 |
+
"content": "<pad>",
|
32 |
+
"lstrip": false,
|
33 |
+
"normalized": false,
|
34 |
+
"rstrip": false,
|
35 |
+
"single_word": false
|
36 |
+
},
|
37 |
+
"sep_token": {
|
38 |
+
"content": "</s>",
|
39 |
+
"lstrip": false,
|
40 |
+
"normalized": false,
|
41 |
+
"rstrip": false,
|
42 |
+
"single_word": false
|
43 |
+
},
|
44 |
+
"unk_token": {
|
45 |
+
"content": "<unk>",
|
46 |
+
"lstrip": false,
|
47 |
+
"normalized": false,
|
48 |
+
"rstrip": false,
|
49 |
+
"single_word": false
|
50 |
+
}
|
51 |
+
}
|
tokenizer.json
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:883b037111086fd4dfebbbc9b7cee11e1517b5e0c0514879478661440f137085
|
3 |
+
size 17082987
|
tokenizer_config.json
ADDED
@@ -0,0 +1,54 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"added_tokens_decoder": {
|
3 |
+
"0": {
|
4 |
+
"content": "<s>",
|
5 |
+
"lstrip": false,
|
6 |
+
"normalized": false,
|
7 |
+
"rstrip": false,
|
8 |
+
"single_word": false,
|
9 |
+
"special": true
|
10 |
+
},
|
11 |
+
"1": {
|
12 |
+
"content": "<pad>",
|
13 |
+
"lstrip": false,
|
14 |
+
"normalized": false,
|
15 |
+
"rstrip": false,
|
16 |
+
"single_word": false,
|
17 |
+
"special": true
|
18 |
+
},
|
19 |
+
"2": {
|
20 |
+
"content": "</s>",
|
21 |
+
"lstrip": false,
|
22 |
+
"normalized": false,
|
23 |
+
"rstrip": false,
|
24 |
+
"single_word": false,
|
25 |
+
"special": true
|
26 |
+
},
|
27 |
+
"3": {
|
28 |
+
"content": "<unk>",
|
29 |
+
"lstrip": false,
|
30 |
+
"normalized": false,
|
31 |
+
"rstrip": false,
|
32 |
+
"single_word": false,
|
33 |
+
"special": true
|
34 |
+
},
|
35 |
+
"250001": {
|
36 |
+
"content": "<mask>",
|
37 |
+
"lstrip": true,
|
38 |
+
"normalized": false,
|
39 |
+
"rstrip": false,
|
40 |
+
"single_word": false,
|
41 |
+
"special": true
|
42 |
+
}
|
43 |
+
},
|
44 |
+
"bos_token": "<s>",
|
45 |
+
"clean_up_tokenization_spaces": true,
|
46 |
+
"cls_token": "<s>",
|
47 |
+
"eos_token": "</s>",
|
48 |
+
"mask_token": "<mask>",
|
49 |
+
"model_max_length": 512,
|
50 |
+
"pad_token": "<pad>",
|
51 |
+
"sep_token": "</s>",
|
52 |
+
"tokenizer_class": "XLMRobertaTokenizer",
|
53 |
+
"unk_token": "<unk>"
|
54 |
+
}
|