Spaces:

pendar02
/

biomedical

Sleeping

pendar02 commited on Jan 10

Commit

d16f597

verified ·

1 Parent(s): 6cd4890

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -84,12 +84,31 @@ def process_excel(uploaded_file):
         st.error(f"Error processing file: {str(e)}")
         return None
 def generate_summary(text, model, tokenizer):
     """Generate summary for single abstract"""
     if not isinstance(text, str) or not text.strip():
         return "No abstract available to summarize."
-    inputs = tokenizer(text, return_tensors="pt", max_length=1024, truncation=True)
     with torch.no_grad():
         summary_ids = model.generate(

         st.error(f"Error processing file: {str(e)}")
         return None
+def preprocess_text(text):
+    """Preprocess text to add appropriate formatting before summarization"""
+    if not isinstance(text, str) or not text.strip():
+        return text
+    # Split text into sentences (basic implementation)
+    sentences = [s.strip() for s in text.replace('. ', '.\n').split('\n')]
+    # Remove empty sentences
+    sentences = [s for s in sentences if s]
+    # Join with proper line breaks
+    formatted_text = '\n'.join(sentences)
+    return formatted_text
 def generate_summary(text, model, tokenizer):
     """Generate summary for single abstract"""
     if not isinstance(text, str) or not text.strip():
         return "No abstract available to summarize."
+    # Preprocess the text first
+    formatted_text = preprocess_text(text)
+    inputs = tokenizer(formatted_text, return_tensors="pt", max_length=1024, truncation=True)
     with torch.no_grad():
         summary_ids = model.generate(