Spaces:

Vishnu-add
/

chat_with_your_doc

Sleeping

App Files Files Community

Vishnu-add commited on Dec 30, 2023

Commit

0361dbf

1 Parent(s): 5dba2dd

Uncommented llm code

Browse files

Files changed (1) hide show

app.py +57 -57

app.py CHANGED Viewed

@@ -16,61 +16,61 @@ from langchain.vectorstores import Chroma
 import os
 st.set_page_config(page_title="pdf-GPT", page_icon="📖", layout="wide")
-# @st.cache_resource
-# def get_model():
-#     device = torch.device('cpu')
-#     # device = torch.device('cuda:0')
-#     checkpoint = "LaMini-T5-738M"
-#     checkpoint = "MBZUAI/LaMini-T5-738M"
-#     tokenizer = AutoTokenizer.from_pretrained(checkpoint)
-#     base_model = AutoModelForSeq2SeqLM.from_pretrained(
-#         checkpoint,
-#         device_map=device,
-#         torch_dtype = torch.float32,
-#         # offload_folder= "/model_ck"
-#     )
-#     return base_model,tokenizer
-# @st.cache_resource
-# def llm_pipeline():
-#     base_model,tokenizer = get_model()
-#     pipe = pipeline(
-#         'text2text-generation',
-#         model = base_model,
-#         tokenizer=tokenizer,
-#         max_length = 512,
-#         do_sample = True,
-#         temperature = 0.3,
-#         top_p = 0.95,
-#         # device=device
-#     )
-#     local_llm = HuggingFacePipeline(pipeline = pipe)
-#     return local_llm
-# @st.cache_resource
-# def qa_llm():
-#     llm = llm_pipeline()
-#     embeddings = SentenceTransformerEmbeddings(model_name="all-MiniLM-L6-v2")
-#     db = Chroma(persist_directory="db", embedding_function = embeddings)
-#     retriever = db.as_retriever()
-#     qa = RetrievalQA.from_chain_type(
-#         llm=llm,
-#         chain_type = "stuff",
-#         retriever = retriever,
-#         return_source_documents=True
-#     )
-#     return qa
-# def process_answer(instruction):
-#     response=''
-#     instruction = instruction
-#     qa = qa_llm()
-#     generated_text = qa(instruction)
-#     answer = generated_text['result']
-#     return answer, generated_text
 # Display conversation history using Streamlit messages
 def display_conversation(history):
@@ -174,8 +174,8 @@ def main():
             # Search the database for a response based on user input and update session state
             if user_input:
-                # answer = process_answer({"query" : user_input})
-                answer = user_input
                 st.session_state["past"].append(user_input)
                 response = answer
                 st.session_state["generated"].append(response)

 import os
 st.set_page_config(page_title="pdf-GPT", page_icon="📖", layout="wide")
+@st.cache_resource
+def get_model():
+    device = torch.device('cpu')
+    # device = torch.device('cuda:0')
+    checkpoint = "LaMini-T5-738M"
+    checkpoint = "MBZUAI/LaMini-T5-738M"
+    tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+    base_model = AutoModelForSeq2SeqLM.from_pretrained(
+        checkpoint,
+        device_map=device,
+        torch_dtype = torch.float32,
+        # offload_folder= "/model_ck"
+    )
+    return base_model,tokenizer
+@st.cache_resource
+def llm_pipeline():
+    base_model,tokenizer = get_model()
+    pipe = pipeline(
+        'text2text-generation',
+        model = base_model,
+        tokenizer=tokenizer,
+        max_length = 512,
+        do_sample = True,
+        temperature = 0.3,
+        top_p = 0.95,
+        # device=device
+    )
+    local_llm = HuggingFacePipeline(pipeline = pipe)
+    return local_llm
+@st.cache_resource
+def qa_llm():
+    llm = llm_pipeline()
+    embeddings = SentenceTransformerEmbeddings(model_name="all-MiniLM-L6-v2")
+    db = Chroma(persist_directory="db", embedding_function = embeddings)
+    retriever = db.as_retriever()
+    qa = RetrievalQA.from_chain_type(
+        llm=llm,
+        chain_type = "stuff",
+        retriever = retriever,
+        return_source_documents=True
+    )
+    return qa
+def process_answer(instruction):
+    response=''
+    instruction = instruction
+    qa = qa_llm()
+    generated_text = qa(instruction)
+    answer = generated_text['result']
+    return answer, generated_text
 # Display conversation history using Streamlit messages
 def display_conversation(history):
             # Search the database for a response based on user input and update session state
             if user_input:
+                answer = process_answer({"query" : user_input})
+                # answer = user_input
                 st.session_state["past"].append(user_input)
                 response = answer
                 st.session_state["generated"].append(response)