Spaces:

loayshabet
/

news-sumarry

Sleeping

App Files Files Community

loayshabet commited on Nov 26, 2024

Commit

fa5e64a

verified ·

1 Parent(s): 5f0f442

Update app.py

Browse files

Files changed (1) hide show

app.py +34 -47

app.py CHANGED Viewed

@@ -21,32 +21,9 @@ TIMEOUT_LIMIT = 30  # Maximum time in seconds to process summaries
 # News sources
 NEWS_SOURCES = {
-    "Technology": {
-        "TheNewYorkTimes": "https://rss.nytimes.com/services/xml/rss/nyt/Technology.xml",
-        "reutersagency": "https://www.reutersagency.com/feed/?best-topics=tech&post_type=best"
-    },
-    "Business": {
-        "TheNewYorkTimes": "https://rss.nytimes.com/services/xml/rss/nyt/Business.xml",
-        "reutersagency": "https://www.reutersagency.com/feed/?best-topics=business-finance&post_type=best"
-    },
-    "Science": {
-        "TheNewYorkTimes": "https://rss.nytimes.com/services/xml/rss/nyt/Science.xml"
-    },
-    "World News": {
-        "TheNewYorkTimes": "https://rss.nytimes.com/services/xml/rss/nyt/World.xml",
-        "BBC": "http://feeds.bbci.co.uk/news/world/rss.xml",
-        "CNN": "http://rss.cnn.com/rss/edition_world.rss",
-        "reutersagency": "https://www.reutersagency.com/feed/?taxonomy=best-regions&post_type=best"
-    },
-    "Sports": {
-        "TheNewYorkTimes": "https://rss.nytimes.com/services/xml/rss/nyt/Sports.xml",
-        "reutersagency": "https://www.reutersagency.com/feed/?best-topics=sports&post_type=best"
-    },
-    "Health": {
-        "TheNewYorkTimes": "https://rss.nytimes.com/services/xml/rss/nyt/Health.xml",
-        "politico": "http://rss.politico.com/healthcare.xml",
-        "reutersagency": "https://www.reutersagency.com/feed/?best-topics=health&post_type=best"
-    }
 }
 # Initialize cache
@@ -84,6 +61,7 @@ def fetch_rss_news(categories):
             try:
                 feed = feedparser.parse(url)
                 for entry in feed.entries:
                     published = datetime(*entry.published_parsed[:6], tzinfo=pytz.UTC)
                     if published > cutoff_time:
                         articles.append({
@@ -114,6 +92,33 @@ def summarize_text(text):
         logging.error(f"Summarization failed: {e}")
         return "Summary unavailable."
 def generate_user_summary(name):
     """Generate a personalized news summary based on user preferences."""
     # Load preferences
@@ -135,16 +140,10 @@ def generate_user_summary(name):
     if not articles:
         return "No recent news found in your selected categories."
-    # Summarize articles
-    summaries = []
-    for article in articles:
-        summary = summarize_text(article["description"])
-        summaries.append(f"""**{article['title']}**
-**Category:** {article['category']} | **Source:** {article['source']} | **Published:** {article['published'].strftime('%Y-%m-%d %H:%M')}
-{summary}
-[Read more]({article['link']})
----""")
     return "\n\n".join(summaries) if summaries else "No summaries available."
 # Gradio interface
@@ -191,15 +190,3 @@ if __name__ == "__main__":

 # News sources
 NEWS_SOURCES = {
+    "Technology": {"NYTimes": "https://rss.nytimes.com/services/xml/rss/nyt/Technology.xml"},
+    "Business": {"Reuters": "https://www.reutersagency.com/feed/?best-topics=business-finance&post_type=best"},
+    "World": {"BBC": "http://feeds.bbci.co.uk/news/world/rss.xml"},
 }
 # Initialize cache
             try:
                 feed = feedparser.parse(url)
                 for entry in feed.entries:
+                    # Parse publication time
                     published = datetime(*entry.published_parsed[:6], tzinfo=pytz.UTC)
                     if published > cutoff_time:
                         articles.append({
         logging.error(f"Summarization failed: {e}")
         return "Summary unavailable."
+def summarize_articles(articles):
+    """Summarize all fetched articles."""
+    summaries = []
+    for article in articles:
+        try:
+            content = article["description"]
+            title = article["title"]
+            category = article["category"]
+            source = article["source"]
+            link = article["link"]
+            published = article["published"].strftime('%Y-%m-%d %H:%M')
+            # Summarize article content
+            summary = summarize_text(content)
+            if summary:
+                summaries.append(f"""
+                **{title}**
+                **Category:** {category} | **Source:** {source} | **Published:** {published}
+                {summary}
+                [Read more]({link})
+                ---""")
+        except Exception as e:
+            logging.error(f"Error summarizing article: {e}")
+            continue
+    return summaries
 def generate_user_summary(name):
     """Generate a personalized news summary based on user preferences."""
     # Load preferences
     if not articles:
         return "No recent news found in your selected categories."
+    # Summarize all articles
+    summaries = summarize_articles(articles)
+    # Combine and return summaries
     return "\n\n".join(summaries) if summaries else "No summaries available."
 # Gradio interface