Spaces:
Sleeping
Sleeping
add app v.0.1
Browse files- Example/File.txt +1 -0
- README.md +1 -1
- __pycache__/summarizer.cpython-38.pyc +0 -0
- app.py +23 -0
- requirements.txt +2 -0
- summarizer.py +38 -0
Example/File.txt
ADDED
@@ -0,0 +1 @@
|
|
|
|
|
1 |
+
पूर्वी नेपाल में अपशिष्ट जल प्रबंधन के लिए भारत 4 करोड़ रुपये से ज्यादा की मदद देगा। भारतीय दूतावास ने नेपाल सरकार के संघीय मामले और सामान्य प्रशासन विभाग और खुंबु पासंग ल्हामू ग्रामीण नगर पालिका, सोलुखुंबु के साथ खुमजुंग खुंडे अपशिष्ट जल प्रबंधन परियोजना के निर्माण के समझौते पर हस्ताक्षर किए हैं। भारत इसमें 4.10 करोड़ से ज्यादा की वित्तीय मदद देगा।भारतीय दूतावास ने बताया कि इस परियोजना से सोलुखुंबु के खुमजुंग गांव में रहने वाले लोगों को सुरक्षित पानी मिल सकेगा और स्वच्छता में सुधार होगा, जो सार्वजनिक स्वास्थ्य में सुधार के लिए जरूरी हैं।निकट पड़ोसी भारत और नेपाल के बीच व्यापक और बहुक्षेत्रीय सहयोग है। यह परियोजना लागू होने से अपने लोगों के जीवन स्तर को उठाने के लिए नेपाल सरकार के प्रयासों में भारतीय सहयोग परिलक्षित होगा।
|
README.md
CHANGED
@@ -1,6 +1,6 @@
|
|
1 |
---
|
2 |
title: Hindi_News_Summarizer
|
3 |
-
emoji:
|
4 |
colorFrom: indigo
|
5 |
colorTo: yellow
|
6 |
sdk: gradio
|
|
|
1 |
---
|
2 |
title: Hindi_News_Summarizer
|
3 |
+
emoji: 📰
|
4 |
colorFrom: indigo
|
5 |
colorTo: yellow
|
6 |
sdk: gradio
|
__pycache__/summarizer.cpython-38.pyc
ADDED
Binary file (1.09 kB). View file
|
|
app.py
ADDED
@@ -0,0 +1,23 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
import gradio as gr
|
2 |
+
from summarizer import summarize
|
3 |
+
|
4 |
+
|
5 |
+
with open("Example/File.txt", 'r', encoding="utf8") as f:
|
6 |
+
text = f.read()
|
7 |
+
|
8 |
+
sample = [text]
|
9 |
+
|
10 |
+
interface = gr.Interface(fn = summarize,
|
11 |
+
inputs = [gr.inputs.Textbox(lines=5,
|
12 |
+
placeholder="Enter your text...",
|
13 |
+
label='News Input'),
|
14 |
+
gr.inputs.Radio(["T5", "BART"], type="value", label='Model')
|
15 |
+
],
|
16 |
+
|
17 |
+
outputs = [gr.outputs.Textbox(
|
18 |
+
label="Sar")],
|
19 |
+
|
20 |
+
title = "Hindi News Summarizer",
|
21 |
+
examples=[sample])
|
22 |
+
|
23 |
+
interface.launch(debug=True)
|
requirements.txt
ADDED
@@ -0,0 +1,2 @@
|
|
|
|
|
|
|
1 |
+
torch
|
2 |
+
transformers
|
summarizer.py
ADDED
@@ -0,0 +1,38 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
import re
|
2 |
+
from transformers import AutoModelForSeq2SeqLM, AutoTokenizer
|
3 |
+
|
4 |
+
def summarize(text, model):
|
5 |
+
|
6 |
+
if model == "T5":
|
7 |
+
checkpoint = "csebuetnlp/mT5_multilingual_XLSum"
|
8 |
+
elif model == "BART":
|
9 |
+
checkpoint = "ai4bharat/IndicBART"
|
10 |
+
|
11 |
+
WHITESPACE_HANDLER = lambda k: re.sub('\s+', ' ', re.sub('\n+', ' ', k.strip()))
|
12 |
+
|
13 |
+
|
14 |
+
tokenizer = AutoTokenizer.from_pretrained(checkpoint)
|
15 |
+
model = AutoModelForSeq2SeqLM.from_pretrained(checkpoint)
|
16 |
+
|
17 |
+
|
18 |
+
input_ids = tokenizer(
|
19 |
+
[WHITESPACE_HANDLER(text)],
|
20 |
+
return_tensors="pt",
|
21 |
+
padding="max_length",
|
22 |
+
truncation=True,
|
23 |
+
max_length=512 )["input_ids"]
|
24 |
+
|
25 |
+
output_ids = model.generate(
|
26 |
+
input_ids=input_ids,
|
27 |
+
max_length=70,
|
28 |
+
min_length=30,
|
29 |
+
no_repeat_ngram_size=2,
|
30 |
+
num_beams=4 )[0]
|
31 |
+
|
32 |
+
|
33 |
+
summary = tokenizer.decode(
|
34 |
+
output_ids,
|
35 |
+
skip_special_tokens=True,
|
36 |
+
clean_up_tokenization_spaces=False )
|
37 |
+
|
38 |
+
return summary
|