Spaces:

nuseAI
/

fastAPIv2

Sleeping

App Files Files Community

ragV98 commited on Jul 23

Commit

faed34c

1 Parent(s): 2bdf31a

again

Browse files

Files changed (1) hide show

components/generators/daily_feed.py +21 -17

components/generators/daily_feed.py CHANGED Viewed

@@ -1,10 +1,12 @@
 import os
 import json
 import redis
 from typing import List, Dict
 from openai import OpenAI
 from components.indexers.news_indexer import get_upstash_vector_store
-from llama_index.core import VectorStoreIndex, StorageContext
 # 🔐 Environment variables
 REDIS_URL = os.environ.get("UPSTASH_REDIS_URL", "redis://localhost:6379")
@@ -28,26 +30,29 @@ BASE_PROMPT = (
     "Return up to 3 punchy headlines, each under 20 words, written like a premium editorial bulletin."
 )
-# 📥 Load topic-wise documents from Upstash vector store
 def load_all_documents_grouped_by_topic() -> Dict[str, List[str]]:
-    topic_docs = {}
     try:
         vector_store = get_upstash_vector_store()
-        storage_context = StorageContext.from_defaults(vector_store=vector_store)
-        # 🔍 Load all documents from vector store
-        all_nodes = vector_store._data.values()  # Upstash uses `_data` internally to store nodes
-        for node in all_nodes:
             try:
-                content = node.get_content().strip()
-                topic = node.metadata.get("topic", "").lower().replace(" news", "")
-                if not content or not topic:
-                    continue
-                topic_docs.setdefault(topic, []).append(content)
             except Exception as e:
-                print(f"❌ [Node processing error]", e)
     except Exception as e:
         print("❌ [load_all_documents_grouped_by_topic Error]", e)
@@ -62,9 +67,9 @@ def summarize_topic(topic_key: str, docs: List[str]) -> List[Dict]:
     try:
         client = OpenAI(api_key=OPENAI_API_KEY)
-        content = "\n\n---\n\n".join(docs)[:12000]  # trim to avoid token overflow
-        print(f"🧠 Summarizing topic via the OpenAI: {topic_key}")
         completion = client.chat.completions.create(
             model="gpt-4",
             messages=[
@@ -96,7 +101,6 @@ def generate_and_cache_daily_feed():
     try:
         print("🆕 Running OpenAI-powered daily feed generator....")
         topic_docs = load_all_documents_grouped_by_topic()
-        print('Loaded topics', topic_docs)
         feed_map = {}
         for topic_key in TOPIC_KEYS:

 import os
 import json
 import redis
+import numpy as np
 from typing import List, Dict
 from openai import OpenAI
 from components.indexers.news_indexer import get_upstash_vector_store
+from llama_index.core import StorageContext
+from llama_index.vector_stores.types import VectorStoreQuery
 # 🔐 Environment variables
 REDIS_URL = os.environ.get("UPSTASH_REDIS_URL", "redis://localhost:6379")
     "Return up to 3 punchy headlines, each under 20 words, written like a premium editorial bulletin."
 )
+# 📥 Load documents grouped by topic from Upstash
 def load_all_documents_grouped_by_topic() -> Dict[str, List[str]]:
+    topic_docs = {key: [] for key in TOPIC_KEYS}
     try:
         vector_store = get_upstash_vector_store()
+        for topic, key in zip(TOPICS, TOPIC_KEYS):
             try:
+                dummy_vector = np.random.rand(384).tolist()  # Assuming MiniLM embeddings
+                query = VectorStoreQuery(
+                    query_embedding=dummy_vector,
+                    similarity_top_k=50,
+                    filters={"topic": topic}
+                )
+                result = vector_store.query(query)
+                for node in result.nodes:
+                    content = node.get_content().strip()
+                    if content:
+                        topic_docs[key].append(content)
             except Exception as e:
+                print(f"❌ [Topic Metadata Filter error: {key}]", e)
     except Exception as e:
         print("❌ [load_all_documents_grouped_by_topic Error]", e)
     try:
         client = OpenAI(api_key=OPENAI_API_KEY)
+        content = "\n\n---\n\n".join(docs)[:12000]
+        print(f"🧠 Summarizing topic via OpenAI: {topic_key}")
         completion = client.chat.completions.create(
             model="gpt-4",
             messages=[
     try:
         print("🆕 Running OpenAI-powered daily feed generator....")
         topic_docs = load_all_documents_grouped_by_topic()
         feed_map = {}
         for topic_key in TOPIC_KEYS: