File size: 4,226 Bytes
f211e05
0e40916
 
 
419c959
dfe7a9a
0e40916
0196e3b
2fdffb2
 
256d9e6
419c959
0196e3b
419c959
0196e3b
419c959
 
0196e3b
ca20aaf
 
363eccd
419c959
0196e3b
85ced4c
7bc5e31
0196e3b
961c986
7bc5e31
 
 
 
 
 
 
 
 
 
 
961c986
0faefde
 
 
 
 
c409b58
0faefde
 
 
b25704e
604f610
0faefde
 
961c986
0faefde
11ee808
1798e6c
0faefde
 
ec3ce91
0b883d6
ff222fd
6dd4b2d
961c986
2e6096e
363eccd
c47847c
 
803967e
dec5886
 
c47847c
1c299fa
363eccd
9627eaf
363eccd
803967e
 
 
 
 
363eccd
803967e
6a29910
803967e
 
2e6096e
803967e
2e6096e
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
---
language:
- ar
metrics:
- Accuracy
library_name: transformers
pipeline_tag: text2text-generation
tags:
- t5
- text2text-generation
- text2text
- Classification and Generation
- Classification
- Generation
- ArabicT5
- Text Classification
- Text2Text Generation
widget:
- example_title: الرياضة
- text: |
    خسارة مدوية لليفربول امام تولوز وفوز كبير لبيتيس
---

# # ArabicT5 Model for Arabic News Classification and Generation 
  - The model is under trial

# # The number in the generated text represents the category of the news, as shown below:
  category_mapping = {
  
      'Political':1,
      'Economy':2,
      'Health':3,
      'Sport':4,
      'Culture':5,
      'Technology':6,
      'Art':7,
      'Accidents':8
  }
# # Training parameters

|                       |              |
| :-------------------: | :-----------:|
|  Training batch size  |     `8`      |
| Evaluation batch size |     `8`      |
|     Learning rate     |    `1e-4`    |
|    Max length input   |     `64`     |
|   Max length target   |    `512`     |
|     Number workers    |     `4`      |
|         Epoch         |     `5`      |
|                       |              |


# # Results

|                         |               |
| :---------------------: | :-----------: | 
|   Evaluation Loss       |    `3.94`     |  
|    Training Loss        |    `3.20`     |   
| Classification Accuracy |   `96.17%`     | 
|   Generation Accuracy   |   `87.16%`    |


# # Example usage
```python

from transformers import T5ForConditionalGeneration, T5Tokenizer, pipeline

model_name="Hezam/ArabicT5-news-classification-generation"
model = T5ForConditionalGeneration.from_pretrained(model_name)
tokenizer = T5Tokenizer.from_pretrained(model_name)
generation_pipeline = pipeline("text2text-generation",model=model,tokenizer=tokenizer)

text = " خسارة مدوية لليفربول امام تولوز وفوز كبير لبيتيس"

output= generation_pipeline(text,
                            num_beams=4,
                            max_length=512,
                            top_p=0.9,
                            repetition_penalty = 3.0,
                            no_repeat_ngram_size = 3)[0]["generated_text"]

output

```
['4 كتبت لبني عبد الله خسر فريق ليفربول الانجليزي نظيره تولوز بهدفين مقابل هدف المباراه جمعت الفريقين اليوم الاربعاء استاد القاهره الدولي ضمن منافسات الجوله التاسعه والعشرين عمر مسابقه الدوري المصري الممتاز ويسعي بيتيس لتحقيق الفوز في مباراه فريقه المقبله ضد تولوز بهدف رد سجله احمد سيد زيزو لاعب الفريق الاول لكره القدم بنادي ليفربول والتي انتهت بالتعادل الايجابي بهدف لكل فريق ليواصل سيطرته المركز الثاني بجدول ترتيب الدوري برصيد نقطه بعدما لعب مباريات حقق الفوز مباريات وتعادل لقاءات وخسر مواجهات وسجل لاعبوه هدفا وتلقت شباكه']
```bash
['4 كتبت لبني عبد الله خسر فريق ليفربول الانجليزي نظيره تولوز بهدفين مقابل هدف المباراه جمعت الفريقين اليوم الاربعاء استاد القاهره الدولي ضمن منافسات الجوله التاسعه والعشرين عمر مسابقه الدوري المصري الممتاز ويسعي بيتيس لتحقيق الفوز في مباراه فريقه المقبله ضد تولوز بهدف رد سجله احمد سيد زيزو لاعب الفريق الاول لكره القدم بنادي ليفربول والتي انتهت بالتعادل الايجابي بهدف لكل فريق ليواصل سيطرته المركز الثاني بجدول ترتيب الدوري برصيد نقطه بعدما لعب مباريات حقق الفوز مباريات وتعادل لقاءات وخسر مواجهات وسجل لاعبوه هدفا وتلقت شباكه']
```