Spaces:

rtabrizi
/

RAG

Runtime error

rtabrizi commited on Aug 27, 2023

Commit

d6f6f10

1 Parent(s): fa7567e

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -86,7 +86,7 @@ class Retriever:
     self.index.add(self.token_embeddings)
   def retrieve_top_k(self, query_prompt, k=10):
-    encoded_query = self.question_tokenizer(query_prompt, return_tensors="pt", truncation=True, padding=True).to(device)
     with torch.no_grad():
         model_output = self.question_model(**encoded_query)
@@ -138,7 +138,7 @@ class RAG:
       context = self.retriever.retrieve_top_k(question, k=15)
-      inputs = self.generator_tokenizer(question, ". ".join(context), return_tensors="pt", truncation=True, max_length=300 , padding="max_length")
       with torch.no_grad():
         model_inputs = inputs.to(device)
         outputs = self.generator_model(**model_inputs)

     self.index.add(self.token_embeddings)
   def retrieve_top_k(self, query_prompt, k=10):
+    encoded_query = self.question_tokenizer(query_prompt, return_tensors="pt", max_length=300, truncation=True, padding=True).to(device)
     with torch.no_grad():
         model_output = self.question_model(**encoded_query)
       context = self.retriever.retrieve_top_k(question, k=15)
+      inputs = self.generator_tokenizer(question, ". ".join(context), return_tensors="pt", truncation=True, max_length=300, padding="max_length")
       with torch.no_grad():
         model_inputs = inputs.to(device)
         outputs = self.generator_model(**model_inputs)