Spaces:

anasmkh
/

chabi

Sleeping

App Files Files Community

chabi / main.py

anasmkh

Update main.py

61b75fc over 1 year ago

raw

history blame

2.53 kB

	from langchain.chains import RetrievalQA, ConversationalRetrievalChain
	from langchain.vectorstores import Chroma
	from langchain.text_splitter import CharacterTextSplitter
	from langchain.document_loaders import DirectoryLoader, TextLoader,PyPDFLoader
	from transformers import pipeline, AutoModelForCausalLM
	from langchain.llms import HuggingFacePipeline
	from langchain.embeddings import HuggingFaceInstructEmbeddings
	import gradio as gr
	from InstructorEmbedding import INSTRUCTOR
	import torch
	from transformers import AutoTokenizer, AutoModelForSeq2SeqLM

	from transformers import AutoModelForSequenceClassification, AutoTokenizer

	# model = AutoModelForSequenceClassification.from_pretrained("distilbert-base-uncased-finetuned-mrpc")
	# tokenizer = AutoTokenizer.from_pretrained("distilbert-base-uncased-finetuned-mrpc")


	#
	# tokenizer = AutoTokenizer.from_pretrained("google/flan-t5-base")
	#
	# model = AutoModelForSeq2SeqLM.from_pretrained("google/flan-t5-base")

	model_id = "gpt2-medium"
	tokenizer = AutoTokenizer.from_pretrained(model_id)
	model = AutoModelForCausalLM.from_pretrained(model_id)

	pipeline = pipeline(
	"text-generation",
	model=model,
	tokenizer=tokenizer,
	max_length=100
	)

	# local_llm = HuggingFacePipeline(pipeline=pipeline)
	# pipe = pipeline(
	# "text2text-generation",
	# model=model,
	# tokenizer=tokenizer,
	# max_length=512,
	# temperature=0.5,
	# top_p=0.95,
	# repetition_penalty=1.15
	# )

	local_llm = HuggingFacePipeline(pipeline=pipeline)
	# print(local_llm('What is the capital of Syria?'))
	loader = PyPDFLoader('bipolar.pdf')
	# loader = TextLoader('info.txt')
	document = loader.load()
	text_spliter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
	texts = text_spliter.split_documents(document)
	embedding = HuggingFaceInstructEmbeddings()
	docsearch = Chroma.from_documents(texts, embedding, persist_directory='db')

	retriever = docsearch.as_retriever(search_kwargs={"k": 3})
	qa_chain = RetrievalQA.from_chain_type(llm=local_llm,
	chain_type="map_reduce",
	retriever=retriever,
	return_source_documents=True)
	# question = input('prompt: ')
	# result = qa_chain({'query': question})
	# print('result: ', result['result'])
	def gradinterface(query,history):
	result = qa_chain({'query': query})
	return result['result']


	demo = gr.ChatInterface(fn=gradinterface, title='OUR_OWN_BOT')

	if __name__ == "__main__":
	demo.launch(share=True)