Bu model "https://github.com/stefan-it/turkish-bert" base alınarak geliştirilmiş bir NER(Varlık ismi tanıma) modelidir.

Eğitim ve validasyon verisi

Fine-tune işlemi için TDD-NER-202112-CC-001 veri seti kullanılmıştır.

@article{tur-etal-2003-milliyet, title={A statistical information extraction system for Turkish}, volume={9}, DOI={10.1017/S135132490200284X}, number={2}, journal={Natural Language Engineering}, publisher={Cambridge University Press}, author={Tür, Gökhan and Hakkani-Tür, Dilek and Oflazer, Kemal}, year={2003}, pages={181–210} }

Hiperparametreler

custom_labels = ["O","B-LOC","I-LOC","B-ORG","I-ORG","B-PER","I-PER"]

model_args = { "train_batch_size": 32, "eval_batch_size": 32, "num_train_epochs": 3, "seed":1, "save_steps": 625, "overwrite_output_dir": True, "output_dir": "/content/Model" }

Nasıl Kullanılacağı

from transformers import pipeline

pipe = pipeline("token-classification", model="Gorengoz/bert-based-Turkish-NER")
pipe("Entity X'in müşteri hizmetleri hızlı ve etkili, Entity Y'nin ürün kalitesi çok kötü.",aggregation_strategy = "simple"")
Downloads last month
9
Safetensors
Model size
110M params
Tensor type
F32
·
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.