alakxender commited on
Commit
ebc7a6d
·
1 Parent(s): ac63d12
Files changed (3) hide show
  1. README.md +0 -1
  2. app.py +117 -4
  3. requirements.txt +4 -0
README.md CHANGED
@@ -7,7 +7,6 @@ sdk: gradio
7
  sdk_version: 5.9.0
8
  app_file: app.py
9
  pinned: false
10
- short_description: Combines the Google Translator and the BART summarization
11
  ---
12
 
13
  Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference
 
7
  sdk_version: 5.9.0
8
  app_file: app.py
9
  pinned: false
 
10
  ---
11
 
12
  Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference
app.py CHANGED
@@ -1,7 +1,120 @@
 
 
 
 
 
1
  import gradio as gr
 
 
2
 
3
- def greet(name):
4
- return "Hello " + name + "!!"
5
 
6
- demo = gr.Interface(fn=greet, inputs="text", outputs="text")
7
- demo.launch()
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ """ This app combines the Google Translator and the BART summarization model to translate and summarize text.
2
+
3
+ Note: The app have limitations on the text length. It can only handle up to 5000 characters. The app is designed to be used in the Dhivehi language. This is not a finetuned dhivehi model. this is a simple pipeline to utilize existing modes/models of translation and summarization.
4
+ """
5
+ import spaces
6
  import gradio as gr
7
+ from deep_translator import GoogleTranslator
8
+ from transformers import pipeline
9
 
10
+ pipe = pipeline("summarization", model="facebook/bart-large-cnn")
 
11
 
12
+ summary_type = {
13
+ "short":{
14
+ "description":"Best for: Executive overviews, abstracts, or capturing the essence of a text briefly.",
15
+ "min_length":20, "max_length":50
16
+ },
17
+ "medium":{
18
+ "description":"Best for: Detailed summaries, reports, or providing a comprehensive overview of a text.",
19
+ "min_length":50, "max_length":100
20
+ },
21
+ "detail":{
22
+ "description":"Best for: In-depth analysis, detailed reports, or providing a comprehensive overview of a text.",
23
+ "min_length":100, "max_length":200
24
+ }
25
+ }
26
+
27
+ @spaces.GPU
28
+ def translate_text(text, s_type):
29
+ if len(text) > 4999:
30
+ gr.Warning("Text is too long. Please enter a shorter text.")
31
+ return "Text is too long. Please enter a shorter text.", "", ""
32
+ # Initialize the translator
33
+ translator = GoogleTranslator(source="dhivehi", target="english")
34
+
35
+ # Perform the translation
36
+ translation = translator.translate(text)
37
+
38
+ # Summarize the text
39
+ summary = summarize_text(translation, s_type)
40
+
41
+ # Translate the summary to Dhivehi
42
+ translator = GoogleTranslator(source="english", target="dhivehi")
43
+ summary_dhivehi = translator.translate(summary)
44
+
45
+ # Return the translated text
46
+ return translation, summary, summary_dhivehi
47
+
48
+ def summarize_text(text, s_type):
49
+ min_length = summary_type[s_type]["min_length"]
50
+ max_length = summary_type[s_type]["max_length"]
51
+ #print(f"Min length: {min_length}, Max length: {max_length}")
52
+ summary = pipe(text, max_length=max_length, min_length=min_length, do_sample=False)
53
+ return summary[0]['summary_text']
54
+
55
+ eg_text1 = """ގޭމިން ޕްލެޓްފޯމް ރޯބްލޮކްސް އިން ރިމޯޓް ޕޭރެންޓަލް ކޮންޓްރޯލް އާ އެކު ރައްކާތެރިކަމުގެ ބޮޑެތި އަޕްގްރޭޑްތަކެއް އިއުލާނުކޮށް، 13 އަހަރުން ދަށުގެ ކުދިންނަށް އެ ޕްލެޓްފޯމްގައި އެހެން މީހުންނާ މުއާސަލާތު ނުކުރެވޭ ގޮތް ހަދަން ނިންމައިފި އެވެ.
56
+
57
+ ރޯބްލޮކްސް އަކީ 2004 ވަނަ އަހަރު އުފެއްދި މަޝްހޫރު އޮންލައިން ގޭމިން އަދި ކްރިއޭޓިވިޓީއާ ގުޅުން ހުރި އެތައް ކަމަކަށް ހާއްސަ ޕްލެޓްފޯމެކެވެ.
58
+
59
+ ރޯބްލޮކްސް ބޭނުންކުރާ ކުދިންނަށް، އެހެން މީހުން އުފައްދާ ގޭމްތަކާއި "އެކްސްޕީރިއަންސް" ތަކުން ބޭނުން ކަމެއް އިޚްތިޔާރުކޮށް، އޮންލައިންކޮށް ގޭމް ކުޅެ އަދި ރިއަލް ޓައިމްގައި އެ މީހުންނާ އެކު ޗެޓް ކުރެވޭ އެވެ.
60
+
61
+ ރޯބްލޮކްސް ބޭނުންކުރާ މީހުން ދުނިޔޭގެ އެކި ކަންކޮޅުތަކުގައި އުޅެ އެވެ. ހާއްސަކޮށް، ކުޑަކުދިންނާއި ޒުވާނުންގެ އެތައް މިލިއަން ބަޔަކު ބޭނުންކުރާ އިރު، ފަހުގެ ދިރާސާތަކާއި މީޑިއާ ރިޕޯޓްތައް ބުނާ ގޮތުން އެ މި ޕްލެޓްފޯމްގައި ސްކޭމްކުރާ މީހުންނާއި ނުބައި ނިޔަތުގައި އުޅޭ މީހުން ގިނަ އެވެ. އަދި މީގައި ކުޑަކުދިން އެކަށީގެންވާ މިންވަރަށް ހިމާޔަތެއް ވެސް ނުކުރެ އެވެ.
62
+
63
+ ބްލޫމްބާގްއިން މިދިޔަ އަހަރު ނެރުނު ރިޕޯޓެއްގައި ބުނެފައިވާ ގޮތުގައި ރޯބްލޮކްސް ތެރެއިން ބައްދަލުވެ ކުދިން ގްރޫމްކޮށް، ޖިންސީ ގޯނާކޮށް ނުވަތަ ވަގަށް ނެގުން ފަދަ މައްސަަލަތައް ބޮޑެވެ. މިފަދަ މައްސަލަތަކުގައި 2018 ވަނަ އަހަރުން ފެށިގެން މިހާތަނަށް 24 މީހަކު ހައްޔަރުކޮށްފައިވާ ކަމަށް ވަނީ ބުނެފަ އެވެ.
64
+
65
+ އެ ރިޕޯޓްގައި ބުނެފައިވަނީ ކާކުކަން ނޭނގޭ އެކައުންޓްތަކުގެ ސަބަބުން، ނުބައި އަމަލުތައް ހިންގުމުގެ ނިޔަތުގައި އުޅޭ މީހުން ދެނެގަންނަން ދަތިވާ ކަމަށެވެ.
66
+
67
+ - އަލަށް އެޅި ފިޔަވަޅުތަކުގެ ސަބަބުން ބެލެ��ިވެރިންނަށް ދަރިންގެ ހަރަކާތްތައް މޮނިޓާކޮށް، އަމިއްލަ ޑިވައިސްތަކުން ވަގުތު މާ ގާތުން ބެލޭނެ.
68
+
69
+ - އަދި 13 އަހަރުން ދަށުގެ ކުދިންނަށް ގޭމްތަކުގެ ބޭރުން ޑައިރެކްޓް މެސެޖިންގެ ފުރުސަތު މިހާރު ނުލިބޭނެ ކަމަށާއި ޑިފޯލްޓްކޮށް ތަޖުރިބާގެ ތެރޭގައި ޕަބްލިކް ބްރޯޑްކާސްޓް ކުރާ މެސެޖުތަކަށް އެކަނި ވެސް އެ ކުންފުނިން ބުންޏެވެ.
70
+
71
+ "ރޯބްލޮކްސްގައި ކޮންމެ ކަމެއް ކުރާއިރު ވެސް އެންމެ ބޮޑު އިސްކަމެއް ދެނީ ކަސްޓަމަރުންގެ ރައްކާތެރިކަމަށް،" ޗީފް ސޭފްޓީ އޮފިސަރު މެޓް ކޯފްމަން ވިދާޅުވި އެވެ.
72
+
73
+ މި ގެންނަ ބަދަލުތަކުގެ ތެރޭގައި، ކޮންޓެންޓް ޓައިޕް ލޭބަލްތަކަށް ބަލައި އުމުރާ ގުޅޭ ގޮތުން ކޮންޓެންޓް ރޭޓިން ކަނޑައެޅުން ދޫކޮށްލުން ހިމެނެ އެވެ. މި އުސޫލު ދޫކޮށްލުމަށް ފަހު ހަދަނީ ނުވަ އަހަރުން ދަށުގެ ކަސްޓަމަރުން "މިނިމަލް" ނުވަތަ "މައިލްޑް" ކޮންޓެންޓަށް ބެލެނިވެރިން ހުއްދަ ދީގެން ނޫނީ ނުބެލޭ ގޮތަށެވެ.
74
+
75
+ "މި އަޕްޑޭޓްތަކުގެ ސަބަބުން، ދަރިފުޅަށް އެންމެ އެކަށީގެންވާ ކަންކަމާ ގުޅޭ ގޮތުން ރަނގަޅު ނިންމުންތައް ނިންމުމަށް ބެލެނިވެރިންނަށް އިތުރަށް ފަސޭހަވާނެ،" ކޯފްމަން ވިދާޅުވި އެވެ."""
76
+
77
+ eg_text2 = """ސަރުކާރުގެ އޮފީސްތަކުގެ އޮންލައިން ޕޯޓަލް ކަމަށްވާ އީފާސްގެ ފޭސް ރެކޮގްނިޝަންގެ އާ ވެންޑާއަކަށް ލެޓްވިއާގެ ކުންފުންޏެއް ސަރުކާރުން ހަމަޖައްސައިފި އެވެ.
78
+
79
+ އެންސީއައިޓީން މިއަދު ނެރުނު ނޫސްބަޔާނެއްގައި ބުނީ، އީފާސްގެ ފޭސް ރެކޮގްނިޝަން ހިދުމަތް ދިނުމަށް ކުރިން ހަވާލުކޮށްފައިވާ "ސަމް އެންޑް ސަބްސްޓެންސް ޕްރައިވެޑް ލިމިޓެޑް" (ސަމްސަބް) ކުންފުނި އެ މަސައްކަތުން ވަކިކޮށް، އާ ވެންޑާއަކާ މަސައްކަތް ހަވާލުކުރުމަށް ފަހު އަލުން އޮންލައިން ފޭސް ވެރިފިކޭޝަންގެ ހިދުމަތް މިހާރު ފަށާފައިވާ ކަމަށެވެ.
80
+
81
+ ސަމްސަބް އަކީ އިނގިރޭސިވިލާތުގައި ރަޖިސްޓްރީކޮށްފައި އޮންނަ އިޒްރޭލުގެ ބަޔަކު އުފައްދާފައިވާ ކުންފުންޏެކެވެ. އެހެންވެ، އެކަމުގައި އާންމުންގެ ފާޑުކިޔުން ބޮޑުވުމުން ސަރުކާރުން އެ ކުންފުނި ވަކިކުރީ އެވެ.
82
+
83
+ އާންމުންގެ ފާޑުކިޔުންތަކާ ގުޅިގެން އެންސީއައިޓީން އޭރު ބުނެފައި ވަނީ ސަމްސަބްއާ އެ ހިދުމަތް ދިނުމަށް ހަވާލުކުރީ އެ ކުންފުންޏަކީ އިނގިރޭސިވިލާތުގެ ގާނޫނުގެ ދަށުން ހިންގާ ބަޔަކަށް ވާތީ ކަމަށެވެ. އަދި ފޮޓޯ ފިޔަވާ އެއްވެސް ދިވެއްސެއްގެ ޒާތީ މައުލޫމާތު އެ ކުންފުންޏަށް ނޭނގޭނެ ކަމަށް އޭރު ބުނެފައިވެ އެވެ.
84
+
85
+ އެންސީއައިޓީގެ ބަޔާނުގައި ބުނީ އާ ވެންޑާއަކަށް ހަމަޖައްސާފައި ވަނީ ޔޫރަޕުގެ ގައުމެއް ކަމަށްވާ ލެޓްވިއާގައި ރަޖިސްޓަރީކޮށްފައިވާ ރެގިއުލާ ފޮރެންސިކްސް ނަމަކަށް ކިޔާ ކުންފުންޏެއް ކަމަށެވެ. ފޭސް ވެރިފިކޭޝަން ހެދުމަށް މިހާރު ބޭނުންކުރަނީ އެ ކުންފުނީގެ އެޕްލިކޭޝަނެއް ކަމަށް ވެސް އެ ބަޔާނުގައި ބުންޏެވެ.
86
+
87
+ "އަދި، މިކަން ހިނގާނީ ބޭރުގެ އެއްވެސް ފަރާތަކަށް އެއްވެސް ރައްޔިތެއްގެ ފޮޓޯއެއް ނުވަތަ އެ ނޫން ވެސް އެހެން ޒާތީ މައުލޫމާތެއް ހިއްސާކުރުމަކާ ނުލައި އެންސީއައިޓީގެ އެތެރޭގަ އެވެ،" ބަޔާނުގައި ބުންޏެވެ.
88
+
89
+ ރެގިއުލާ ފޮރެންސިކްސް އަކީ، އެންސީއައިޓީން ބުނި ގޮތުގައި، 30 އަހަރުގެ ތަޖުރިބާއާ އެކު، ސެކިއުރިޓީގެ ދާއިރާއިން ގިނަ ޑިޖިޓަލް ހިދުމަތްތަކެއް ފޯރުކޮށްދޭ ގާބިލް އަދި ބައިނަލްއަގުވާމީ ބޮޑެތި ކުންފުނިތަކާ ތަފާތު އެކި ގައުމުތަކަށް ވެސް ހިދުމަތްދެމުން އަންނަ އިތުބާރު ��ުރި ކުންފުންޏެކެވެ.
90
+
91
+ އެންސީއައިޓީން ބުނީ މިވަގުތު ފޭސް ރިކޮގްނިޝަންގެ ހިދުމަތް ލިބޭނީ ވެބް ބްރައުޒާއެއް މެދުވެރިކޮށް އީފާސް އަށް ލޮގިންވާއިރު އެކަނި ކަމަށެވެ.
92
+ """
93
+
94
+ css = """
95
+ .textbox1 textarea {
96
+ font-size: 18px !important;
97
+ font-family: 'MV_Faseyha', 'Faruma', 'A_Faruma' !important;
98
+ line-height: 1.8 !important;
99
+ }
100
+ """
101
+
102
+ # Define the Gradio interface
103
+ iface = gr.Interface(
104
+ fn=translate_text, # Function to wrap
105
+ inputs=[
106
+ gr.Textbox(lines=2, placeholder="ލިޔުމެއް", label="Dhivehi Text", rtl=True, elem_classes="textbox1"), # Text input
107
+ gr.Radio(summary_type.keys(), label="Summary Type", value="medium")
108
+ ],
109
+ css=css,
110
+ outputs=[gr.Textbox(label="English Text", lines=2), gr.Textbox(label="English Summarized Text", lines=2), gr.Textbox(label="Dhivehi Summary", lines=2, rtl=True, elem_classes="textbox1")], # Output type
111
+ title="Dhivehi Translation and Summarization",
112
+ description="Translate text from Dhivehi to English and summarize the text in English and Dhivehi.",
113
+ examples=[
114
+ [eg_text1, "medium"],
115
+ [eg_text2, "short"]
116
+ ]
117
+ )
118
+
119
+ # Launch the Gradio interface
120
+ iface.launch()
requirements.txt ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ deep-translator
2
+ transformers
3
+ tensorflow
4
+ tf-keras