File size: 4,226 Bytes
f211e05 0e40916 419c959 dfe7a9a 0e40916 0196e3b 2fdffb2 256d9e6 419c959 0196e3b 419c959 0196e3b 419c959 0196e3b ca20aaf 363eccd 419c959 0196e3b 85ced4c 7bc5e31 0196e3b 961c986 7bc5e31 961c986 0faefde c409b58 0faefde b25704e 604f610 0faefde 961c986 0faefde 11ee808 1798e6c 0faefde ec3ce91 0b883d6 ff222fd 6dd4b2d 961c986 2e6096e 363eccd c47847c 803967e dec5886 c47847c 1c299fa 363eccd 9627eaf 363eccd 803967e 363eccd 803967e 6a29910 803967e 2e6096e 803967e 2e6096e |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 |
---
language:
- ar
metrics:
- Accuracy
library_name: transformers
pipeline_tag: text2text-generation
tags:
- t5
- text2text-generation
- text2text
- Classification and Generation
- Classification
- Generation
- ArabicT5
- Text Classification
- Text2Text Generation
widget:
- example_title: الرياضة
- text: |
خسارة مدوية لليفربول امام تولوز وفوز كبير لبيتيس
---
# # ArabicT5 Model for Arabic News Classification and Generation
- The model is under trial
# # The number in the generated text represents the category of the news, as shown below:
category_mapping = {
'Political':1,
'Economy':2,
'Health':3,
'Sport':4,
'Culture':5,
'Technology':6,
'Art':7,
'Accidents':8
}
# # Training parameters
| | |
| :-------------------: | :-----------:|
| Training batch size | `8` |
| Evaluation batch size | `8` |
| Learning rate | `1e-4` |
| Max length input | `64` |
| Max length target | `512` |
| Number workers | `4` |
| Epoch | `5` |
| | |
# # Results
| | |
| :---------------------: | :-----------: |
| Evaluation Loss | `3.94` |
| Training Loss | `3.20` |
| Classification Accuracy | `96.17%` |
| Generation Accuracy | `87.16%` |
# # Example usage
```python
from transformers import T5ForConditionalGeneration, T5Tokenizer, pipeline
model_name="Hezam/ArabicT5-news-classification-generation"
model = T5ForConditionalGeneration.from_pretrained(model_name)
tokenizer = T5Tokenizer.from_pretrained(model_name)
generation_pipeline = pipeline("text2text-generation",model=model,tokenizer=tokenizer)
text = " خسارة مدوية لليفربول امام تولوز وفوز كبير لبيتيس"
output= generation_pipeline(text,
num_beams=4,
max_length=512,
top_p=0.9,
repetition_penalty = 3.0,
no_repeat_ngram_size = 3)[0]["generated_text"]
output
```
['4 كتبت لبني عبد الله خسر فريق ليفربول الانجليزي نظيره تولوز بهدفين مقابل هدف المباراه جمعت الفريقين اليوم الاربعاء استاد القاهره الدولي ضمن منافسات الجوله التاسعه والعشرين عمر مسابقه الدوري المصري الممتاز ويسعي بيتيس لتحقيق الفوز في مباراه فريقه المقبله ضد تولوز بهدف رد سجله احمد سيد زيزو لاعب الفريق الاول لكره القدم بنادي ليفربول والتي انتهت بالتعادل الايجابي بهدف لكل فريق ليواصل سيطرته المركز الثاني بجدول ترتيب الدوري برصيد نقطه بعدما لعب مباريات حقق الفوز مباريات وتعادل لقاءات وخسر مواجهات وسجل لاعبوه هدفا وتلقت شباكه']
```bash
['4 كتبت لبني عبد الله خسر فريق ليفربول الانجليزي نظيره تولوز بهدفين مقابل هدف المباراه جمعت الفريقين اليوم الاربعاء استاد القاهره الدولي ضمن منافسات الجوله التاسعه والعشرين عمر مسابقه الدوري المصري الممتاز ويسعي بيتيس لتحقيق الفوز في مباراه فريقه المقبله ضد تولوز بهدف رد سجله احمد سيد زيزو لاعب الفريق الاول لكره القدم بنادي ليفربول والتي انتهت بالتعادل الايجابي بهدف لكل فريق ليواصل سيطرته المركز الثاني بجدول ترتيب الدوري برصيد نقطه بعدما لعب مباريات حقق الفوز مباريات وتعادل لقاءات وخسر مواجهات وسجل لاعبوه هدفا وتلقت شباكه']
``` |