Spaces:

ssaiteja16
/

RagBenchCapstone10

Sleeping

Saiteja Solleti

correcting scores

5633e27 3 months ago

3.99 kB

	import gradio as gr
	import os

	from loaddataset import ExtractRagBenchData
	from createmilvusschema import CreateMilvusDbSchema
	from insertmilvushelper import EmbedAllDocumentsAndInsert
	from sentence_transformers import SentenceTransformer
	from searchmilvushelper import SearchTopKDocuments
	from finetuneresults import FineTuneAndRerankSearchResults
	from generationhelper import GenerateAnswer
	from formatresultshelper import FormatAndScores
	from calculatescores import CalculateScores

	from huggingface_hub import login
	from huggingface_hub import whoami
	from huggingface_hub import dataset_info


	# Load embedding model
	QUERY_EMBEDDING_MODEL = SentenceTransformer('all-MiniLM-L6-v2')
	RERANKING_MODEL = "cross-encoder/ms-marco-MiniLM-L-6-v2"
	PROMPT_MODEL = "llama-3.3-70b-specdec"
	EVAL_MODEL = "llama-3.3-70b-specdec"
	WINDOW_SIZE = 5
	OVERLAP = 2
	RETRIVE_TOP_K_SIZE=10


	hf_token = os.getenv("HF_TOKEN")
	login(hf_token)

	rag_extracted_data = ExtractRagBenchData()
	print(rag_extracted_data.head(5))

	"""
	EmbedAllDocumentsAndInsert(QUERY_EMBEDDING_MODEL, rag_extracted_data, db_collection, window_size=WINDOW_SIZE, overlap=OVERLAP)
	"""

	def EvaluateRAGModel(query, evaluation_model):
	#invoke create milvus db function
	try:
	db_collection = CreateMilvusDbSchema()
	except Exception as e:
	print(f"Error creating Milvus DB schema: {e}")

	#insert embdeding to milvus db

	#query = "what would the net revenue have been in 2015 if there wasn't a stipulated settlement from the business combination in october 2015?"

	results_for_top10_chunks = SearchTopKDocuments(db_collection, query, QUERY_EMBEDDING_MODEL, top_k=RETRIVE_TOP_K_SIZE)

	reranked_results = FineTuneAndRerankSearchResults(results_for_top10_chunks, rag_extracted_data, query, RERANKING_MODEL)

	answer = GenerateAnswer(query, reranked_results.head(3), PROMPT_MODEL)

	completion_result,relevant_sentence_keys,all_utilized_sentence_keys,support_keys,support_level = FormatAndScores(query, reranked_results.head(1), answer, EVAL_MODEL)


	print(relevant_sentence_keys)
	print(all_utilized_sentence_keys)
	print(support_keys)
	print(support_level)
	print(completion_result)

	document_id = reranked_results.head(1)['doc_id'].values[0]
	extarcted_row_for_given_id = rag_extracted_data[rag_extracted_data["id"]==document_id]

	rmsecontextrel, rmsecontextutil, aucscore = CalculateScores(relevant_sentence_keys,all_utilized_sentence_keys,support_keys,support_level,extarcted_row_for_given_id)

	print(rmsecontextrel)
	print(rmsecontextutil)
	print(aucscore)

	return answer, rmsecontextrel, rmsecontextutil, aucscore


	# Create Gradio UI
	with gr.Blocks() as iface:
	gr.Markdown("## Capstone Project Group 10 - Model Evaluation")

	with gr.Row():
	question_input = gr.Textbox(label="Enter your Question", lines=2)
	dropdown_input = gr.Dropdown(
	["LLaMA 3.3", "Mistral &B", "Model C"],
	value="LLaMA 3.3",
	label="Select a Model"
	)

	submit_button = gr.Button("Evaluate Model")

	with gr.Row():
	with gr.Column():
	gr.Markdown("### Response")
	response = gr.Textbox(interactive=False, show_label=False, lines=2)

	with gr.Row():
	with gr.Column():
	gr.Markdown("### RMSE-CONTEXT RELEVANCE")
	rmsecontextrel = gr.Textbox(interactive=False, show_label=False, lines=2)

	with gr.Column():
	gr.Markdown("### RMSE-CONTEXT UTILIZATION")
	rmsecontextutil = gr.Textbox(interactive=False, show_label=False, lines=2)

	with gr.Column():
	gr.Markdown("### AUCROC ADHERENCE")
	aucscore = gr.Textbox(interactive=False, show_label=False, lines=2)

	# Connect submit button to evaluation function
	submit_button.click(EvaluateRAGModel, inputs=[question_input, dropdown_input], outputs=[response, rmsecontextrel, rmsecontextutil, aucscore])

	# Run the Gradio app
	iface.launch()