Spaces:

Tonyivan
/

seriatim

Sleeping

App Files Files Community

Tonyivan commited on Nov 19, 2024

Commit

7c6c308

verified ·

1 Parent(s): 409504b

Update app.py

Browse files

Files changed (1) hide show

app.py +44 -36

app.py CHANGED Viewed

@@ -2,53 +2,62 @@ from fastapi import FastAPI, HTTPException
 from pydantic import BaseModel
 from sentence_transformers import SentenceTransformer, util
 from transformers import pipeline
-import numpy as np
 from typing import List
 app = FastAPI()
 model = SentenceTransformer("sentence-transformers/all-MiniLM-L6-v2")
 question_model = "deepset/tinyroberta-squad2"
 nlp = pipeline('question-answering', model=question_model, tokenizer=question_model)
 summarizer = pipeline("summarization", model="facebook/bart-large-cnn")
-# Define request models
 class ModifyQueryRequest(BaseModel):
     query_string: str
-# Define request models
 class ModifyQueryRequest_v3(BaseModel):
-    query_string_list: [str]
 class AnswerQuestionRequest(BaseModel):
     question: str
-    context: list
-    locations: list
 class T5QuestionRequest(BaseModel):
     context: str
-class T5Response(BaseModel):
-    answer: str
-# Define response models (if needed)
 class ModifyQueryResponse(BaseModel):
-    embeddings: list
 class AnswerQuestionResponse(BaseModel):
     answer: str
-    locations: list
-# Define API endpoints
 @app.post("/modify_query", response_model=ModifyQueryResponse)
 async def modify_query(request: ModifyQueryRequest):
     try:
-        binary_embeddings = model.encode([request.query_string], precision="binary")
-        return ModifyQueryResponse(embeddings=binary_embeddings[0].tolist())
     except Exception as e:
-        raise HTTPException(status_code=500, detail=str(e))
 @app.post("/answer_question", response_model=AnswerQuestionResponse)
 async def answer_question(request: AnswerQuestionRequest):
@@ -58,42 +67,41 @@ async def answer_question(request: AnswerQuestionRequest):
         corpus_embeddings = model.encode(request.context, convert_to_tensor=True)
         query_embeddings = model.encode(request.question, convert_to_tensor=True)
         hits = util.semantic_search(query_embeddings, corpus_embeddings)
         for hit in hits[0]:
-            if hit['score'] > .4:
                 loc = hit['corpus_id']
                 res_locs.append(request.locations[loc])
                 context_string += request.context[loc] + ' '
-        if len(res_locs) == 0:
-            ans = "Sorry, I couldn't find any results for your query. Please try again!"
         else:
             QA_input = {
                 'question': request.question,
-                'context': context_string.replace('\n',' ')
             }
             result = nlp(QA_input)
-            ans = result['answer']
-        return AnswerQuestionResponse(answer=ans, locations = res_locs)
     except Exception as e:
-        raise HTTPException(status_code=500, detail=str(e))
 @app.post("/t5answer", response_model=T5Response)
 async def t5answer(request: T5QuestionRequest):
-    resp = summarizer(request.context, max_length=130, min_length=30, do_sample=False)
-    return T5Response(answer = resp[0]["summary_text"])
-# Define API endpoints
-@app.post("/modify_query_v3", response_model=ModifyQueryResponse)
-async def modify_query2(request: ModifyQueryRequest_v3):
     try:
-        embeddings = model.encode(request.query_string_list)
-        return ModifyQueryResponse(embeddings=[emb.tolist() for emb in embeddings])
     except Exception as e:
-        raise HTTPException(status_code=500, detail=str(e))
 if __name__ == "__main__":
     import uvicorn
     uvicorn.run(app, host="0.0.0.0", port=8000)

 from pydantic import BaseModel
 from sentence_transformers import SentenceTransformer, util
 from transformers import pipeline
 from typing import List
+import numpy as np
 app = FastAPI()
+# Load models
 model = SentenceTransformer("sentence-transformers/all-MiniLM-L6-v2")
 question_model = "deepset/tinyroberta-squad2"
 nlp = pipeline('question-answering', model=question_model, tokenizer=question_model)
 summarizer = pipeline("summarization", model="facebook/bart-large-cnn")
+# Request models
 class ModifyQueryRequest(BaseModel):
     query_string: str
 class ModifyQueryRequest_v3(BaseModel):
+    query_string_list: List[str]
 class AnswerQuestionRequest(BaseModel):
     question: str
+    context: List[str]
+    locations: List[str]
 class T5QuestionRequest(BaseModel):
     context: str
+# Response models
 class ModifyQueryResponse(BaseModel):
+    embeddings: List[List[float]]
 class AnswerQuestionResponse(BaseModel):
     answer: str
+    locations: List[str]
+class T5Response(BaseModel):
+    answer: str
+# API endpoints
 @app.post("/modify_query", response_model=ModifyQueryResponse)
 async def modify_query(request: ModifyQueryRequest):
     try:
+        # Generate embeddings
+        embeddings = model.encode([request.query_string])
+        return ModifyQueryResponse(embeddings=[emb.tolist() for emb in embeddings])
+    except Exception as e:
+        raise HTTPException(status_code=500, detail=f"Error in modifying query: {str(e)}")
+@app.post("/modify_query_v3", response_model=ModifyQueryResponse)
+async def modify_query_v3(request: ModifyQueryRequest_v3):
+    try:
+        # Generate embeddings for a list of query strings
+        embeddings = model.encode(request.query_string_list)
+        return ModifyQueryResponse(embeddings=[emb.tolist() for emb in embeddings])
     except Exception as e:
+        raise HTTPException(status_code=500, detail=f"Error in modifying query v3: {str(e)}")
 @app.post("/answer_question", response_model=AnswerQuestionResponse)
 async def answer_question(request: AnswerQuestionRequest):
         corpus_embeddings = model.encode(request.context, convert_to_tensor=True)
         query_embeddings = model.encode(request.question, convert_to_tensor=True)
         hits = util.semantic_search(query_embeddings, corpus_embeddings)
+        # Collect relevant contexts
         for hit in hits[0]:
+            if hit['score'] > 0.4:
                 loc = hit['corpus_id']
                 res_locs.append(request.locations[loc])
                 context_string += request.context[loc] + ' '
+        # If no relevant contexts are found
+        if not res_locs:
+            answer = "Sorry, I couldn't find any results for your query. Please try again!"
         else:
+            # Use the question-answering pipeline
             QA_input = {
                 'question': request.question,
+                'context': context_string.replace('\n', ' ')
             }
             result = nlp(QA_input)
+            answer = result['answer']
+        return AnswerQuestionResponse(answer=answer, locations=res_locs)
     except Exception as e:
+        raise HTTPException(status_code=500, detail=f"Error in answering question: {str(e)}")
 @app.post("/t5answer", response_model=T5Response)
 async def t5answer(request: T5QuestionRequest):
     try:
+        # Summarize the context
+        response = summarizer(request.context, max_length=130, min_length=30, do_sample=False)
+        return T5Response(answer=response[0]["summary_text"])
     except Exception as e:
+        raise HTTPException(status_code=500, detail=f"Error in T5 summarization: {str(e)}")
 if __name__ == "__main__":
     import uvicorn
     uvicorn.run(app, host="0.0.0.0", port=8000)