|
--- |
|
language: |
|
- ar |
|
metrics: |
|
- Accuracy |
|
library_name: transformers |
|
pipeline_tag: text2text-generation |
|
tags: |
|
- t5 |
|
- text2text-generation |
|
- text2text |
|
- Classification and Generation |
|
- Classification |
|
- Generation |
|
- ArabicT5 |
|
- Text Classification |
|
- Text2Text Generation |
|
widget: |
|
- example_title: الرياضة |
|
- text: | |
|
خسارة مدوية لليفربول امام تولوز وفوز كبير لبيتيس |
|
--- |
|
|
|
# # ArabicT5 Model for Arabic News Classification and Generation |
|
- The model is under trial |
|
|
|
# # The number in the generated text represents the category of the news, as shown below: |
|
category_mapping = { |
|
|
|
'Political':1, |
|
'Economy':2, |
|
'Health':3, |
|
'Sport':4, |
|
'Culture':5, |
|
'Technology':6, |
|
'Art':7, |
|
'Accidents':8 |
|
} |
|
# # Training parameters |
|
|
|
| | | |
|
| :-------------------: | :-----------:| |
|
| Training batch size | `8` | |
|
| Evaluation batch size | `8` | |
|
| Learning rate | `1e-4` | |
|
| Max length input | `64` | |
|
| Max length target | `512` | |
|
| Number workers | `4` | |
|
| Epoch | `5` | |
|
| | | |
|
|
|
|
|
# # Results |
|
|
|
| | | |
|
| :---------------------: | :-----------: | |
|
| Evaluation Loss | `3.94` | |
|
| Training Loss | `3.20` | |
|
| Classification Accuracy | `96.17%` | |
|
| Generation Accuracy | `87.16%` | |
|
|
|
|
|
# # Example usage |
|
```python |
|
|
|
from transformers import T5ForConditionalGeneration, T5Tokenizer, pipeline |
|
|
|
model_name="Hezam/ArabicT5-news-classification-generation" |
|
model = T5ForConditionalGeneration.from_pretrained(model_name) |
|
tokenizer = T5Tokenizer.from_pretrained(model_name) |
|
generation_pipeline = pipeline("text2text-generation",model=model,tokenizer=tokenizer) |
|
|
|
text = " خسارة مدوية لليفربول امام تولوز وفوز كبير لبيتيس" |
|
|
|
output= generation_pipeline(text, |
|
num_beams=4, |
|
max_length=512, |
|
top_p=0.9, |
|
repetition_penalty = 3.0, |
|
no_repeat_ngram_size = 3)[0]["generated_text"] |
|
|
|
output |
|
|
|
``` |
|
['4 كتبت لبني عبد الله خسر فريق ليفربول الانجليزي نظيره تولوز بهدفين مقابل هدف المباراه جمعت الفريقين اليوم الاربعاء استاد القاهره الدولي ضمن منافسات الجوله التاسعه والعشرين عمر مسابقه الدوري المصري الممتاز ويسعي بيتيس لتحقيق الفوز في مباراه فريقه المقبله ضد تولوز بهدف رد سجله احمد سيد زيزو لاعب الفريق الاول لكره القدم بنادي ليفربول والتي انتهت بالتعادل الايجابي بهدف لكل فريق ليواصل سيطرته المركز الثاني بجدول ترتيب الدوري برصيد نقطه بعدما لعب مباريات حقق الفوز مباريات وتعادل لقاءات وخسر مواجهات وسجل لاعبوه هدفا وتلقت شباكه'] |
|
```bash |
|
['4 كتبت لبني عبد الله خسر فريق ليفربول الانجليزي نظيره تولوز بهدفين مقابل هدف المباراه جمعت الفريقين اليوم الاربعاء استاد القاهره الدولي ضمن منافسات الجوله التاسعه والعشرين عمر مسابقه الدوري المصري الممتاز ويسعي بيتيس لتحقيق الفوز في مباراه فريقه المقبله ضد تولوز بهدف رد سجله احمد سيد زيزو لاعب الفريق الاول لكره القدم بنادي ليفربول والتي انتهت بالتعادل الايجابي بهدف لكل فريق ليواصل سيطرته المركز الثاني بجدول ترتيب الدوري برصيد نقطه بعدما لعب مباريات حقق الفوز مباريات وتعادل لقاءات وخسر مواجهات وسجل لاعبوه هدفا وتلقت شباكه'] |
|
``` |