Spaces:

broadfield-dev
/

grok_test

Runtime error

App Files Files Community

broadfield-dev commited on Feb 20

Commit

ae30ab9

verified ·

1 Parent(s): dda464b

Update app.py

Browse files

Files changed (1) hide show

app.py +66 -13

app.py CHANGED Viewed

@@ -1,9 +1,10 @@
 import os
 import threading
-from flask import Flask, render_template, request, jsonify, Response
 from rss_processor import fetch_rss_feeds, process_and_store_articles, vector_db
 import logging
-import json
 app = Flask(__name__)
@@ -13,21 +14,18 @@ logger = logging.getLogger(__name__)
 # Global flag to track background loading
 loading_complete = False
 def load_feeds_in_background():
-    global loading_complete
     try:
         logger.info("Starting background RSS feed fetch")
         articles = fetch_rss_feeds()
         logger.info(f"Fetched {len(articles)} articles")
         process_and_store_articles(articles)
         logger.info("Background feed processing complete")
         loading_complete = True
-        # Notify frontend of new data (simulated via SSE for simplicity)
-        def event_stream():
-            yield f"data: {json.dumps({'status': 'updated'})}\n\n"
-        app.response_class = Response
-        return Response(event_stream(), mimetype="text/event-stream")
     except Exception as e:
         logger.error(f"Error in background feed loading: {e}")
         loading_complete = True
@@ -58,17 +56,23 @@ def index():
             key = f"{title}|{link}"
             if key not in seen_keys:
                 seen_keys.add(key)
                 enriched_articles.append({
                     "title": title,
                     "link": link,
                     "description": meta.get("original_description", "No Description"),
                     "category": meta.get("category", "Uncategorized"),
-                    "published": meta.get("published", "Unknown Date"),
                     "image": meta.get("image", "svg"),
                 })
-        # Sort by published date (assuming ISO format or comparable string)
-        enriched_articles.sort(key=lambda x: x["published"], reverse=True)
         # Group by category and limit to 10 most recent per category
         categorized_articles = {}
@@ -127,10 +131,59 @@ def search():
 @app.route('/check_loading')
 def check_loading():
-    global loading_complete
     if loading_complete:
-        return jsonify({"status": "complete"})
     return jsonify({"status": "loading"}), 202
 if __name__ == "__main__":
     app.run(host="0.0.0.0", port=7860)

 import os
 import threading
+from flask import Flask, render_template, request, jsonify
 from rss_processor import fetch_rss_feeds, process_and_store_articles, vector_db
 import logging
+import time
+from datetime import datetime
 app = Flask(__name__)
 # Global flag to track background loading
 loading_complete = False
+last_update_time = time.time()
 def load_feeds_in_background():
+    global loading_complete, last_update_time
     try:
         logger.info("Starting background RSS feed fetch")
         articles = fetch_rss_feeds()
         logger.info(f"Fetched {len(articles)} articles")
         process_and_store_articles(articles)
+        last_update_time = time.time()  # Update timestamp when new articles are added
         logger.info("Background feed processing complete")
         loading_complete = True
     except Exception as e:
         logger.error(f"Error in background feed loading: {e}")
         loading_complete = True
             key = f"{title}|{link}"
             if key not in seen_keys:
                 seen_keys.add(key)
+                # Try to parse published date, fallback to string sorting
+                published = meta.get("published", "Unknown Date")
+                try:
+                    published = datetime.strptime(published, "%Y-%m-%d %H:%M:%S").isoformat() if "Unknown" not in published else published
+                except (ValueError, TypeError):
+                    pass  # Keep as is if parsing fails
                 enriched_articles.append({
                     "title": title,
                     "link": link,
                     "description": meta.get("original_description", "No Description"),
                     "category": meta.get("category", "Uncategorized"),
+                    "published": published,
                     "image": meta.get("image", "svg"),
                 })
+        # Sort by published date (handle both datetime and string)
+        enriched_articles.sort(key=lambda x: x["published"] if "Unknown" not in x["published"] else "1970-01-01", reverse=True)
         # Group by category and limit to 10 most recent per category
         categorized_articles = {}
 @app.route('/check_loading')
 def check_loading():
+    global loading_complete, last_update_time
     if loading_complete:
+        return jsonify({"status": "complete", "last_update": last_update_time})
     return jsonify({"status": "loading"}), 202
+@app.route('/get_updates')
+def get_updates():
+    global last_update_time
+    try:
+        all_docs = vector_db.get(include=['documents', 'metadatas'])
+        if not all_docs.get('metadatas'):
+            return jsonify({"articles": [], "last_update": last_update_time})
+        enriched_articles = []
+        seen_keys = set()
+        for doc, meta in zip(all_docs['documents'], all_docs['metadatas']):
+            if not meta:
+                continue
+            title = meta.get("title", "No Title")
+            link = meta.get("link", "")
+            key = f"{title}|{link}"
+            if key not in seen_keys:
+                seen_keys.add(key)
+                published = meta.get("published", "Unknown Date")
+                try:
+                    published = datetime.strptime(published, "%Y-%m-%d %H:%M:%S").isoformat() if "Unknown" not in published else published
+                except (ValueError, TypeError):
+                    pass
+                enriched_articles.append({
+                    "title": title,
+                    "link": link,
+                    "description": meta.get("original_description", "No Description"),
+                    "category": meta.get("category", "Uncategorized"),
+                    "published": published,
+                    "image": meta.get("image", "svg"),
+                })
+        enriched_articles.sort(key=lambda x: x["published"], reverse=True)
+        categorized_articles = {}
+        for article in enriched_articles:
+            cat = article["category"]
+            if cat not in categorized_articles:
+                categorized_articles[cat] = []
+            categorized_articles[cat].append(article)
+        # Limit to 10 most recent per category
+        for cat in categorized_articles:
+            categorized_articles[cat] = sorted(categorized_articles[cat], key=lambda x: x["published"], reverse=True)[:10]
+        return jsonify({"articles": categorized_articles, "last_update": last_update_time})
+    except Exception as e:
+        logger.error(f"Error fetching updates: {e}")
+        return jsonify({"articles": {}, "last_update": last_update_time}), 500
 if __name__ == "__main__":
     app.run(host="0.0.0.0", port=7860)