Text2Text Generation
Transformers
PyTorch
TensorFlow
Arabic
t5
Arabic T5
MSA
Twitter
Arabic Dialect
Arabic Machine Translation
Arabic Text Summarization
Arabic News Title and Question Generation
Arabic Paraphrasing and Transliteration
Arabic Code-Switched Translation
text-generation-inference
Inference Endpoints
Update README.md
Browse files
README.md
CHANGED
@@ -9,29 +9,47 @@ This is the repository accompanying our paper [AraT5: Text-to-Text Transformers
|
|
9 |
---
|
10 |
# How to use AraT5 models
|
11 |
Below is an example for fine-tuning **AraT5-base** for News Title Generation on the Aranews dataset
|
12 |
-
```
|
13 |
-
|
14 |
-
|
15 |
-
|
16 |
-
|
17 |
-
|
18 |
-
|
19 |
-
|
20 |
-
|
21 |
-
|
22 |
-
|
23 |
-
|
24 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
25 |
```
|
26 |
-
|
27 |
-
|
28 |
-
In addition, we release the fine-tuned checkpoint of the News Title Generation (NGT) which is described in the paper. The model available at Huggingface ([UBC-NLP/AraT5-base-title-generation](https://huggingface.co/UBC-NLP/AraT5-base-title-generation)).
|
29 |
-
|
30 |
-
For more details, please visit our own [GitHub](https://github.com/UBC-NLP/araT5).
|
31 |
-
|
32 |
-
|
33 |
|
|
|
|
|
|
|
|
|
|
|
34 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
35 |
|
36 |
# AraT5 Models Checkpoints
|
37 |
|
|
|
9 |
---
|
10 |
# How to use AraT5 models
|
11 |
Below is an example for fine-tuning **AraT5-base** for News Title Generation on the Aranews dataset
|
12 |
+
```python
|
13 |
+
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
|
14 |
+
tokenizer = AutoTokenizer.from_pretrained("UBC-NLP/AraT5-base-title-generation")
|
15 |
+
model = AutoModelForSeq2SeqLM.from_pretrained("UBC-NLP/AraT5-base-title-generation")
|
16 |
+
|
17 |
+
Document = "تحت رعاية صاحب السمو الملكي الأمير سعود بن نايف بن عبدالعزيز أمير المنطقة الشرقية اختتمت غرفة الشرقية مؤخرا، الثاني من مبادرتها لتأهيل وتدريب أبناء وبنات المملكة ضمن مبادرتها المجانية للعام 2019 حيث قدمت 6 برامج تدريبية نوعية. وثمن رئيس مجلس إدارة الغرفة، عبدالحكيم العمار الخالدي، رعاية سمو أمير المنطقة الشرقية للمبادرة، مؤكدا أن دعم سموه لجميع أنشطة ."
|
18 |
+
|
19 |
+
encoding = tokenizer.encode_plus(Document,pad_to_max_length=True, return_tensors="pt")
|
20 |
+
input_ids, attention_masks = encoding["input_ids"], encoding["attention_mask"]
|
21 |
+
|
22 |
+
|
23 |
+
outputs = model.generate(
|
24 |
+
input_ids=input_ids, attention_mask=attention_masks,
|
25 |
+
max_length=256,
|
26 |
+
do_sample=True,
|
27 |
+
top_k=120,
|
28 |
+
top_p=0.95,
|
29 |
+
early_stopping=True,
|
30 |
+
num_return_sequences=5
|
31 |
+
)
|
32 |
+
|
33 |
+
for id, output in enumerate(outputs):
|
34 |
+
title = tokenizer.decode(output, skip_special_tokens=True,clean_up_tokenization_spaces=True)
|
35 |
+
print("title#"+str(id), title)
|
36 |
```
|
37 |
+
**The input news document**
|
|
|
|
|
|
|
|
|
|
|
|
|
38 |
|
39 |
+
<div style="white-space : pre-wrap !important;word-break: break-word; direction:rtl; text-align: right">
|
40 |
+
تحت رعاية صاحب السمو الملكي الأمير سعود بن نايف بن عبدالعزيز أمير المنطقة الشرقية اختتمت غرفة الشرقية مؤخرا، الثاني من مبادرتها لتأهيل وتدريب أبناء وبنات المملكة ضمن مبادرتها المجانية للعام 2019 حيث قدمت 6 برامج تدريبية نوعية. وثمن رئيس مجلس إدارة الغرفة، عبدالحكيم العمار الخالدي، رعاية سمو أمير المنطقة الشرقية للمبادرة، مؤكدا أن دعم سموه لجميع أنشطة .
|
41 |
+
<br>
|
42 |
+
</div>
|
43 |
+
|
44 |
|
45 |
+
**The generated titles**
|
46 |
+
```
|
47 |
+
title#0 غرفة الشرقية تختتم المرحلة الثانية من مبادرتها لتأهيل وتدريب أبناء وبنات المملكة
|
48 |
+
title#1 غرفة الشرقية تختتم الثاني من مبادرة تأهيل وتأهيل أبناء وبناتنا
|
49 |
+
title#2 سعود بن نايف يختتم ثانى مبادراتها لتأهيل وتدريب أبناء وبنات المملكة
|
50 |
+
title#3 أمير الشرقية يرعى اختتام برنامج برنامج تدريب أبناء وبنات المملكة
|
51 |
+
title#4 سعود بن نايف يرعى اختتام مبادرة تأهيل وتدريب أبناء وبنات المملكة
|
52 |
+
```
|
53 |
|
54 |
# AraT5 Models Checkpoints
|
55 |
|