File size: 9,592 Bytes
e664a28 1c17c42 869475d e664a28 1c17c42 820b2f3 b572bf9 e664a28 66e92b1 b572bf9 e664a28 820b2f3 e664a28 b572bf9 e664a28 b572bf9 e664a28 b572bf9 e664a28 fc217b3 e664a28 a8ec187 1c17c42 e664a28 a8ec187 45bd3a9 e664a28 1c17c42 a8ec187 e664a28 869475d |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 |
---
library_name: transformers
license: mit
base_model: dbmdz/bert-base-turkish-cased
tags:
- generated_from_trainer
datasets:
- boun-tabi/squad_tr
metrics:
- f1
model-index:
- name: turkish-question-answering
results:
- task:
name: Question Answering
type: question-answering
dataset:
name: squad_tr
type: squad_tr
config: default
split: train
args: default
metrics:
- name: F1
type: f1
value: 62.01517218037583
language:
- tr
pipeline_tag: question-answering
---
<!-- This model card has been generated automatically according to the information the Trainer had access to. You
should probably proofread and complete it, then remove this comment. -->
# turkish-question-answering
This model is a fine-tuned version of [dbmdz/bert-base-turkish-cased](https://huggingface.co/dbmdz/bert-base-turkish-cased) on the boun-tabi/squad_tr dataset.
The train data was splitted (90-10) and the splitted 10% used as new evaluation set.
It achieves the following results on the evaluation set:
- Loss: 1.2786
- Exact Match: 50.3568
- F1: 62.0152
## Model description
More information needed
## Usage
```python
# Use a pipeline as a high-level helper
from transformers import pipeline
pipe = pipeline("question-answering", model="kaixkhazaki/turkish-question-answering")
#Enter your text and question
#Example
context= """
Nazım Hikmet, Türk edebiyatının en önemli şairlerinden biridir.
Şiirleri genellikle özgürlük, eşitlik ve adalet temalarını işler.
15 Ocak 1902'de Selanik'te doğan şair, yaşamı boyunca birçok zorlukla mücadele etti.
"""
question = "Nazım Hikmet hangi temalar üzerinde yazmıştır?"
pipe(question=question, context=context)
>>
{'score': 0.7749845385551453,
'start': 110,
'end': 137,
'answer': 'özgürlük, eşitlik ve adalet'}
#Example
context = """
Hiperbarik (yüksek basınçlı) tıp, hastanın ve gerektiğinde tıbbi personelin çevresindeki
kısmi O\n2 basıncını artırmak için özel oksijen odaları kullanır. Karbonmonoksit zehirlenmesi,
gazlı kangren ve dekompresyon hastalığı (‘vurgun’) bazen bu cihazlar kullanılarak tedavi edilir.
Akciğerlerde artırılan O\n2 konsantrasyonu, karbonmonoksitin hemoglobin hem grubundan ayrılmasına yardımcı olur.
Oksijen gazı, gaz kangrenine neden olan anaerobik bakteriler için zehirlidir, bu nedenle kısmi basıncının artırılması,
onları öldürmeye yardımcı olur. Dekompresyon hastalığı, bir dalıştan sonra çok hızlı bir şekilde dekompresyon yapan
dalgıçlarda ortaya çıkar, bu da kanlarında çoğunlukla azot ve helyum olan soy gaz kabarcıkları oluşmasına neden olur.
O\n2 basıncının mümkün olan en kısa sürede arttırılması tedavinin bir parçasıdır.'
"""
question= "Karbonmonoksit zehirlenmesi gibi çeşitli durumları tedavi etmek için hangi cihaz kullanılır?"
pipe(question=question, context=context)
>>
{'score': 0.3743631839752197,
'start': 155,
'end': 170,
'answer': 'oksijen odaları'}
```
## Intended uses & limitations
## Training and evaluation data
```bibtex
@misc{budur-etal-2024-squad-tr,
title={Building Efficient and Effective OpenQA Systems for Low-Resource Languages},
author={Emrah Budur and R{\i}za \"{O}z\c{c}elik and
Dilara Soylu and Omar Khattab and
Tunga G\"{u}ng\"{o}r and Christopher Potts},
year={2024},
eprint={2401.03590},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
```
## Training procedure
### Training hyperparameters
The following hyperparameters were used during training:
- learning_rate: 3e-05
- train_batch_size: 16
- eval_batch_size: 64
- seed: 42
- optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
- lr_scheduler_type: linear
- lr_scheduler_warmup_steps: 500
- num_epochs: 3
### Training results
| Training Loss | Epoch | Step | Validation Loss | Exact Match | F1 |
|:-------------:|:------:|:-----:|:---------------:|:-----------:|:-------:|
| 3.0349 | 0.0335 | 200 | 2.7893 | 0.0 | 0.0067 |
| 2.3253 | 0.0670 | 400 | 2.1518 | 11.7680 | 15.5697 |
| 2.0108 | 0.1006 | 600 | 2.0181 | 19.2455 | 23.7003 |
| 1.9105 | 0.1341 | 800 | 1.8422 | 24.4161 | 28.9644 |
| 1.893 | 0.1676 | 1000 | 1.7602 | 29.6921 | 35.4185 |
| 1.7635 | 0.2011 | 1200 | 1.7062 | 26.7003 | 31.6106 |
| 1.8434 | 0.2347 | 1400 | 1.6456 | 31.7693 | 38.0953 |
| 1.6387 | 0.2682 | 1600 | 1.6191 | 29.2502 | 35.6592 |
| 1.6512 | 0.3017 | 1800 | 1.5874 | 36.6594 | 44.5029 |
| 1.6318 | 0.3352 | 2000 | 1.5478 | 31.1712 | 37.5434 |
| 1.6269 | 0.3688 | 2200 | 1.5439 | 37.7275 | 45.9815 |
| 1.5866 | 0.4023 | 2400 | 1.5259 | 33.2852 | 40.1296 |
| 1.5102 | 0.4358 | 2600 | 1.5545 | 31.8182 | 38.3162 |
| 1.5253 | 0.4693 | 2800 | 1.4899 | 41.2113 | 50.4395 |
| 1.4366 | 0.5028 | 3000 | 1.4812 | 40.2321 | 49.6351 |
| 1.6307 | 0.5364 | 3200 | 1.4455 | 41.1860 | 49.6116 |
| 1.4605 | 0.5699 | 3400 | 1.4304 | 38.4629 | 46.3922 |
| 1.4125 | 0.6034 | 3600 | 1.4257 | 41.0046 | 50.8304 |
| 1.4126 | 0.6369 | 3800 | 1.4215 | 41.3979 | 50.7890 |
| 1.5035 | 0.6705 | 4000 | 1.3847 | 39.6329 | 48.5817 |
| 1.3627 | 0.7040 | 4200 | 1.4561 | 29.0115 | 34.8629 |
| 1.4172 | 0.7375 | 4400 | 1.3951 | 45.1590 | 55.5680 |
| 1.4262 | 0.7710 | 4600 | 1.3571 | 42.7241 | 51.8206 |
| 1.3756 | 0.8046 | 4800 | 1.3717 | 43.1109 | 51.3852 |
| 1.3978 | 0.8381 | 5000 | 1.4136 | 48.0715 | 59.8789 |
| 1.4521 | 0.8716 | 5200 | 1.3389 | 41.3291 | 50.7222 |
| 1.4738 | 0.9051 | 5400 | 1.3281 | 38.1464 | 45.8767 |
| 1.372 | 0.9387 | 5600 | 1.3212 | 44.6938 | 54.1932 |
| 1.414 | 0.9722 | 5800 | 1.3104 | 45.1054 | 55.2289 |
| 1.3008 | 1.0057 | 6000 | 1.3411 | 45.8649 | 56.2610 |
| 1.0646 | 1.0392 | 6200 | 1.4034 | 39.6067 | 47.5529 |
| 1.0405 | 1.0727 | 6400 | 1.4081 | 42.7331 | 51.7438 |
| 1.0141 | 1.1063 | 6600 | 1.4326 | 40.6200 | 49.2831 |
| 1.1305 | 1.1398 | 6800 | 1.3429 | 46.5557 | 56.9270 |
| 1.0131 | 1.1733 | 7000 | 1.3695 | 48.7474 | 60.3360 |
| 1.1332 | 1.2068 | 7200 | 1.3221 | 44.8748 | 54.8693 |
| 1.1572 | 1.2404 | 7400 | 1.3601 | 49.7453 | 60.7304 |
| 1.0497 | 1.2739 | 7600 | 1.3221 | 48.4678 | 59.5859 |
| 1.1202 | 1.3074 | 7800 | 1.2960 | 42.6078 | 52.2938 |
| 1.1005 | 1.3409 | 8000 | 1.3422 | 49.1114 | 60.8679 |
| 1.0976 | 1.3745 | 8200 | 1.3270 | 46.8241 | 57.5165 |
| 1.1028 | 1.4080 | 8400 | 1.2932 | 45.9230 | 57.3813 |
| 0.9758 | 1.4415 | 8600 | 1.3032 | 45.1296 | 55.6205 |
| 1.0391 | 1.4750 | 8800 | 1.2878 | 48.0178 | 58.6035 |
| 1.1021 | 1.5085 | 9000 | 1.2840 | 48.8204 | 59.6174 |
| 1.0591 | 1.5421 | 9200 | 1.3227 | 46.5811 | 57.0738 |
| 1.0742 | 1.5756 | 9400 | 1.2771 | 44.4915 | 54.2228 |
| 1.1314 | 1.6091 | 9600 | 1.3067 | 49.2240 | 60.6819 |
| 1.0721 | 1.6426 | 9800 | 1.2839 | 46.6994 | 57.4786 |
| 1.1123 | 1.6762 | 10000 | 1.2718 | 47.7972 | 59.1149 |
| 1.0766 | 1.7097 | 10200 | 1.2688 | 49.3350 | 61.0489 |
| 1.1244 | 1.7432 | 10400 | 1.2575 | 48.4543 | 59.6361 |
| 1.0744 | 1.7767 | 10600 | 1.2788 | 48.7775 | 59.4327 |
| 1.0186 | 1.8103 | 10800 | 1.2620 | 48.6458 | 59.9898 |
| 0.9617 | 1.8438 | 11000 | 1.3137 | 43.1942 | 52.7838 |
| 0.9996 | 1.8773 | 11200 | 1.2786 | 50.3568 | 62.0152 |
| 0.9281 | 1.9108 | 11400 | 1.2849 | 46.7113 | 56.7769 |
| 1.0331 | 1.9444 | 11600 | 1.2693 | 46.9996 | 57.3083 |
| 1.0482 | 1.9779 | 11800 | 1.2636 | 44.8373 | 54.6672 |
| 0.7695 | 2.0114 | 12000 | 1.3635 | 45.9601 | 56.4656 |
| 0.7887 | 2.0449 | 12200 | 1.4005 | 48.8684 | 60.5211 |
| 0.782 | 2.0784 | 12400 | 1.3826 | 49.2449 | 59.9969 |
| 0.7674 | 2.1120 | 12600 | 1.3707 | 47.4254 | 58.1781 |
| 0.7597 | 2.1455 | 12800 | 1.3924 | 48.4130 | 59.9062 |
| 0.7555 | 2.1790 | 13000 | 1.3777 | 47.3922 | 58.6007 |
| 0.7261 | 2.2125 | 13200 | 1.4037 | 50.1306 | 61.4821 |
| 0.7681 | 2.2461 | 13400 | 1.4149 | 48.0112 | 59.3190 |
| 0.7899 | 2.2796 | 13600 | 1.3700 | 46.4242 | 56.9562 |
### Framework versions
- Transformers 4.48.0.dev0
- Pytorch 2.4.1+cu121
- Datasets 2.20.0
- Tokenizers 0.21.0 |