lisaterumi
commited on
Commit
•
61dbaf2
1
Parent(s):
865ae78
Create README.md
Browse files
README.md
ADDED
@@ -0,0 +1,96 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
---
|
2 |
+
language: "pt"
|
3 |
+
widget:
|
4 |
+
- text: "Dispneia importante aos esforços + dor tipo peso no peito no esforço."
|
5 |
+
- text: "Obeso, has, icc c # cintilografia miocardica para avaliar angina. Discreto edema mmii pricn a esquerda."
|
6 |
+
- text: "Plastia Mitral ( Insuficiencia ), CRM Saf-2Mg e e Saf-3MG ).(09/03/16). Nega palpitação."
|
7 |
+
- text: "Uso: AAS 100 -1xd; Metoprolol 25 -1xd; FSM -1xd ; Levotiroxina 175 -1xd; Sinva 40 -1xd; Fluoxetina 20-1xd."
|
8 |
+
- text: "Refere melhora da dispneia depois da cx porem mantem aos mdoeardos-leves esforço."
|
9 |
+
|
10 |
+
datasets:
|
11 |
+
- TempClinBr
|
12 |
+
---
|
13 |
+
|
14 |
+
# Portuguese NER- TempClinBr - BioBERTpt(bio)
|
15 |
+
|
16 |
+
Treinado com BioBERTpt(bio), com o corpus TempClinBr.
|
17 |
+
|
18 |
+
Metricas:
|
19 |
+
|
20 |
+
```
|
21 |
+
precision recall f1-score support
|
22 |
+
|
23 |
+
0 0.44 0.29 0.35 28
|
24 |
+
1 0.75 0.60 0.66 420
|
25 |
+
2 0.57 0.40 0.47 10
|
26 |
+
3 0.57 0.36 0.44 11
|
27 |
+
4 0.70 0.85 0.77 124
|
28 |
+
5 0.72 0.67 0.69 291
|
29 |
+
6 0.84 0.90 0.87 2236
|
30 |
+
7 0.78 0.77 0.77 112
|
31 |
+
8 0.85 0.75 0.80 503
|
32 |
+
9 0.64 0.56 0.60 78
|
33 |
+
10 0.81 0.82 0.81 71
|
34 |
+
11 0.82 1.00 0.90 33
|
35 |
+
|
36 |
+
accuracy 0.81 3917
|
37 |
+
macro avg 0.71 0.66 0.68 3917
|
38 |
+
weighted avg 0.81 0.81 0.80 3917
|
39 |
+
|
40 |
+
```
|
41 |
+
|
42 |
+
Parâmetros:
|
43 |
+
|
44 |
+
```
|
45 |
+
device = cuda (Colab)
|
46 |
+
nclasses = len(tag2id)
|
47 |
+
nepochs = 50 => parou na 16
|
48 |
+
batch_size = 16
|
49 |
+
batch_status = 32
|
50 |
+
learning_rate = 3e-5
|
51 |
+
|
52 |
+
early_stop = 5
|
53 |
+
max_length = 256
|
54 |
+
write_path = 'model'
|
55 |
+
```
|
56 |
+
|
57 |
+
Eval no conjunto de teste - TempClinBr
|
58 |
+
OBS: Avaliação com tag "O" (label 7), se necessário fazer a média sem essa tag.
|
59 |
+
|
60 |
+
```
|
61 |
+
tag2id ={'I-Ocorrencia': 0,
|
62 |
+
'I-Problema': 1,
|
63 |
+
'I-DepartamentoClinico': 2,
|
64 |
+
'B-DepartamentoClinico': 3,
|
65 |
+
'B-Ocorrencia': 4,
|
66 |
+
'B-Tratamento': 5,
|
67 |
+
'O': 6,
|
68 |
+
'B-Teste': 7,
|
69 |
+
'B-Problema': 8,
|
70 |
+
'I-Tratamento': 9,
|
71 |
+
'B-Evidencia': 10,
|
72 |
+
'I-Teste': 11,
|
73 |
+
'<pad>': 12}
|
74 |
+
|
75 |
+
precision recall f1-score support
|
76 |
+
|
77 |
+
0 0.59 0.20 0.29 51
|
78 |
+
1 0.77 0.69 0.73 645
|
79 |
+
2 0.67 0.71 0.69 14
|
80 |
+
3 0.87 0.43 0.58 30
|
81 |
+
4 0.71 0.80 0.75 146
|
82 |
+
5 0.79 0.77 0.78 261
|
83 |
+
6 0.84 0.93 0.88 2431
|
84 |
+
7 0.80 0.66 0.73 194
|
85 |
+
8 0.87 0.83 0.85 713
|
86 |
+
9 0.83 0.62 0.71 146
|
87 |
+
10 0.98 0.91 0.94 128
|
88 |
+
11 0.54 0.21 0.30 99
|
89 |
+
|
90 |
+
accuracy 0.83 4858
|
91 |
+
macro avg 0.77 0.65 0.69 4858
|
92 |
+
weighted avg 0.82 0.83 0.82 4858
|
93 |
+
```
|
94 |
+
|
95 |
+
|
96 |
+
Como citar: **em breve**
|