Spaces:

Kathirsci
/

mistreal

Sleeping

App Files Files Community

Kathirsci commited on Aug 19, 2024

Commit

2976ddc

verified ·

1 Parent(s): 5e0c9a7

Update app.py

Browse files

Files changed (1) hide show

app.py +11 -17

app.py CHANGED Viewed

@@ -1,17 +1,15 @@
 import os
 import logging
-import subprocess
 import tempfile
 from typing import List
 from transformers import pipeline, AutoModelForSeq2SeqLM, AutoTokenizer
 from sentence_transformers import SentenceTransformer
-from langchain.vectorstores import FAISS
-from langchain.document_loaders import PyPDFLoader
 from langchain.prompts import PromptTemplate
 from langchain.schema import Document
 from langchain.text_splitter import CharacterTextSplitter
-from langchain.chains import MapReduceDocumentsChain
-from langchain.runnables import RunnableMap, RunnableLambda
 # Set up logging
 logging.basicConfig(level=logging.INFO)
@@ -89,22 +87,18 @@ def summarize_report(documents: List[Document], llm) -> str:
         map_prompt = PromptTemplate.from_template(map_template)
         # Reduce prompt
-        reduce_template = """Combine these summaries into a final summary with the following structure:\n\nSummary:\n{doc_summaries}\n\nFinal Summary:"""
         reduce_prompt = PromptTemplate.from_template(reduce_template)
-        # Map chain
-        map_chain = RunnableMap(
-            llm_chain=lambda text: llm(text=map_prompt.format(text=text))
         )
-        # Reduce chain
-        reduce_chain = RunnableLambda(
-            llm_chain=lambda doc_summaries: llm(text=reduce_prompt.format(doc_summaries=doc_summaries))
-        )
-        # Run map-reduce sequence
-        summaries = map_chain.run([doc.page_content for doc in documents])
-        summary = reduce_chain.run({"doc_summaries": summaries})
         return summary

 import os
 import logging
 import tempfile
 from typing import List
 from transformers import pipeline, AutoModelForSeq2SeqLM, AutoTokenizer
 from sentence_transformers import SentenceTransformer
+from langchain_community.vectorstores import FAISS
+from langchain_community.document_loaders import PyPDFLoader
 from langchain.prompts import PromptTemplate
 from langchain.schema import Document
 from langchain.text_splitter import CharacterTextSplitter
+from langchain.chains import MapReduceDocumentsChain, ReduceDocumentsChain
 # Set up logging
 logging.basicConfig(level=logging.INFO)
         map_prompt = PromptTemplate.from_template(map_template)
         # Reduce prompt
+        reduce_template = """Combine these summaries into a final summary:\n\nSummary:\n{doc_summaries}\n\nFinal Summary:"""
         reduce_prompt = PromptTemplate.from_template(reduce_template)
+        # Create the chains
+        map_chain = MapReduceDocumentsChain(
+            llm_chain=lambda text: llm(text=map_prompt.format(text=text)),
+            reduce_documents_chain=ReduceDocumentsChain(
+                combine_documents_chain=lambda summaries: llm(text=reduce_prompt.format(doc_summaries=summaries))
+            ),
         )
+        summary = map_chain.run(documents)
         return summary