Spaces:

Samarth991
/

Summarize-PhotoDocument

Sleeping

Samarth991 commited on Mar 28, 2024

Commit

fe84c5e

1 Parent(s): c95667e

adding app

Files changed (1) hide show

app.py CHANGED Viewed

@@ -71,16 +71,17 @@ def summarize_data(docs,llm_model,chain_type='refine'):
                             output_key="output_text",
                             )
     summary = chain({"input_documents": docs}, return_only_outputs=True)
-    output_text  = summary["output_text"].strip()
-    regex = r"CONCISE SUMMARY:(.*)"
-    matches = re.finditer(regex, output_text, re.DOTALL)
-    for matchNum, match in enumerate(matches, start=1):
-        for groupNum in range(0, len(match.groups())):
-            groupNum = groupNum + 1
-            lines = match.group(groupNum).strip().split("\n")
-    return " ".join(lines)
 def process_documents(texts,data_chunk=1000,chunk_overlap=10):
@@ -134,7 +135,7 @@ iface = gr.Interface(
         "file"
     ],
     outputs="text",
-    description ="Summarize your PDF Document having Image • HuggingFace",
 )
 iface.launch()

                             output_key="output_text",
                             )
     summary = chain({"input_documents": docs}, return_only_outputs=True)
+    output_text  = summary["output_text"].replace('\n','')
+    consice_sumary = re.search("CONCISE SUMMARY:.*\.*$", text).group(0)
+    dash_id = consice_sumary.find('-')
+    return consice_sumary[:dash_id]
+    # matches = re.finditer(regex, output_text, re.DOTALL)
+    # for matchNum, match in enumerate(matches, start=1):
+    #     for groupNum in range(0, len(match.groups())):
+    #         groupNum = groupNum + 1
+    #         lines = match.group(groupNum).strip().split("\n")
 def process_documents(texts,data_chunk=1000,chunk_overlap=10):
         "file"
     ],
     outputs="text",
+    description ="Summarize your PDF Document having Image  • HuggingFace",
 )
 iface.launch()