Spaces:

PageOrg
/

summaryapi

Runtime error

App Files Files Community

quyip commited on May 18, 2024

Commit

1f6b7aa

1 Parent(s): 3784e1c

fix

Browse files

Files changed (1) hide show

utils/summary_utils.py +3 -25

utils/summary_utils.py CHANGED Viewed

@@ -9,7 +9,6 @@ AiSummaryVersion = 2
 MinTagScore = 0.7
 summarization_pipeline = pipeline("summarization", model="csebuetnlp/mT5_multilingual_XLSum")
 en_translation_pipe = pipeline("translation", model="Helsinki-NLP/opus-mt-mul-en")
-classification_pipe = pipeline("text-classification", model="Yueh-Huan/news-category-classification-distilbert")
 tag_gen_pipe_1 = pipeline("text-classification", model="yiyanghkust/finbert-esg-9-categories")
 tag_gen_pipe_2 = pipeline("text-classification", model="dima806/news-category-classifier-distilbert")
 tag_gen_pipe_3 = pipeline("text-classification", model="elozano/bert-base-cased-news-category")
@@ -22,9 +21,8 @@ def summarize(id: str, text: str):
         }
     summary = get_summarization(text) if len(text) > 100 else text
     translated = get_en_translation(summary)
-    tags1 = get_classification(translated)
-    tags2 = get_tags(translated)
-    tags = filter_tags(tags1 + tags2)
     tags = sorted(list(set(tags)))
     value = {
@@ -68,29 +66,9 @@ def get_tags(text: str):
     if text is None:
         return []
     try:
-        print(tag_gen_pipe_1(text))
-        print(tag_gen_pipe_2(text))
-        print(tag_gen_pipe_3(text))
         tags1 = [tag['label'] for tag in tag_gen_pipe_1(text) if tag['score'] >= MinTagScore]
         tags2 = [tag['label'] for tag in tag_gen_pipe_2(text) if tag['score'] >= MinTagScore]
         tags3 = [tag['label'] for tag in tag_gen_pipe_3(text) if tag['score'] >= MinTagScore]
-        print(tags1)
-        print(tags2)
-        print(tags3)
-        # print(tags1, tags2, tags3)
-        return []
-    except:
-        return []
-def get_classification(text: str):
-    if text is None:
-        return []
-    try:
-        result = classification_pipe(text)
-        if isinstance(result, list):
-            return [tag['label'].strip() for tag in result if tag['score'] > 0.75]
-        else:
-            return [result['label'].strip()] if result['score'] > 0.75 else []
     except:
         return []

 MinTagScore = 0.7
 summarization_pipeline = pipeline("summarization", model="csebuetnlp/mT5_multilingual_XLSum")
 en_translation_pipe = pipeline("translation", model="Helsinki-NLP/opus-mt-mul-en")
 tag_gen_pipe_1 = pipeline("text-classification", model="yiyanghkust/finbert-esg-9-categories")
 tag_gen_pipe_2 = pipeline("text-classification", model="dima806/news-category-classifier-distilbert")
 tag_gen_pipe_3 = pipeline("text-classification", model="elozano/bert-base-cased-news-category")
         }
     summary = get_summarization(text) if len(text) > 100 else text
     translated = get_en_translation(summary)
+    tags = get_tags(translated)
+    tags = filter_tags(tags)
     tags = sorted(list(set(tags)))
     value = {
     if text is None:
         return []
     try:
         tags1 = [tag['label'] for tag in tag_gen_pipe_1(text) if tag['score'] >= MinTagScore]
         tags2 = [tag['label'] for tag in tag_gen_pipe_2(text) if tag['score'] >= MinTagScore]
         tags3 = [tag['label'] for tag in tag_gen_pipe_3(text) if tag['score'] >= MinTagScore]
+        return tags1 + tags2 + tags3
     except:
         return []