Spaces:

Baweja
/

RAG

Sleeping

Baweja commited on Oct 27, 2024

Commit

ee6ab98

verified ·

1 Parent(s): d7e5236

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -17,7 +17,7 @@ retriever = RagRetriever.from_pretrained("facebook/rag-sequence-nq", index_name=
 rag_model = RagSequenceForGeneration.from_pretrained('facebook/rag-sequence-nq', retriever=retriever)
 rag_model.retriever.init_retrieval()
 rag_model.to(device)
-model = AutoModelForCausalLM.from_pretrained('google/gemma-2-2b-it',
                               device_map = 'auto',
                               torch_dtype = torch.bfloat16,
                              )
@@ -73,7 +73,7 @@ def retrieved_info(query, rag_model = rag_model, generating_model = model):
     generation_model_input = input_format(query, retrieved_context)
     # Generating answer using gemma model
-    tokenizer = AutoTokenizer.from_pretrained("google/gemma-2-2b-it")
     input_ids = tokenizer(generation_model_input, return_tensors='pt').to(device)
     output = generating_model.generate(input_ids, max_new_tokens = 512)

 rag_model = RagSequenceForGeneration.from_pretrained('facebook/rag-sequence-nq', retriever=retriever)
 rag_model.retriever.init_retrieval()
 rag_model.to(device)
+model = AutoModelForCausalLM.from_pretrained('HuggingFaceH4/zephyr-7b-beta',
                               device_map = 'auto',
                               torch_dtype = torch.bfloat16,
                              )
     generation_model_input = input_format(query, retrieved_context)
     # Generating answer using gemma model
+    tokenizer = AutoTokenizer.from_pretrained("HuggingFaceH4/zephyr-7b-beta")
     input_ids = tokenizer(generation_model_input, return_tensors='pt').to(device)
     output = generating_model.generate(input_ids, max_new_tokens = 512)