This model performs subject detect on Turkish texts. It gives sevent outputs:
- "0": "Science & Technology"
- "1": "World"
- "2": "Education"
- "3": "Economy"
- "4": "Current Events"
- "5": "Agenda"
- "6": "Culture & Art & History"
- "7": "Health"
- "8": "Sports"
- "9": "Lifestyle"
The model usage is as follows:
FYI: You can replace the folder redirect with "erythropygia/bert-turkish-subject" in the appropriate fields.
import torch
from transformers import AutoModelForSequenceClassification AutoTokenizer, AutoConfig, pipeline
config_subject = AutoConfig.from_pretrained("erythropygia/bert-turkish-subject")
model_subject = AutoModelForSequenceClassification.from_pretrained('erythropygia/bert-turkish-subject', config=config_subject)
tokenizer_subject = AutoTokenizer.from_pretrained("erythropygia/bert-turkish-subject")
device = torch.device('cpu') #or 'cuda'
subject_pipeline = pipeline(
task='text-classification',
model=model_subject,
tokenizer=tokenizer_subject,
framework='pt',
#device=device
)
input = "Ulus devlet kavramı, 18. yüzyılda aydınlanma düşüncesinin etkisiyle daha da yaygınlaşmış ve 19. yüzyılda Avrupa'da birçok ulus devlet kurulmuştur. Örneğin, Almanya ve İtalya, 1871'de modern anlamda ulus devletler haline gelmiştir.
Dünya genelinde ulus devletlerin yaygınlaşması 20. yüzyılın başlarına kadar devam etmiştir. Bugün, dünya genelinde birçok ulus devlet bulunmaktadır ve bu devletler, çoğunlukla belirli bir ulusun siyasi sınırlar içinde örgütlenmesini temsil etmektedir."
subject_result = subject_pipeline(input)
print(subject_result)
- Downloads last month
- 0
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social
visibility and check back later, or deploy to Inference Endpoints (dedicated)
instead.