Spaces:

Dekode
/

DocLLM

Sleeping

DocLLM / app.py

Pratik Dwivedi

changes to app.py

d353114 over 1 year ago

2.49 kB

	import streamlit as st
	from langchain.document_loaders import PyPDFLoader
	from langchain.indexes import VectorstoreIndexCreator
	from langchain.chains import RetrievalQA, RetrievalQAWithSourcesChain
	from langchain.embeddings import HuggingFaceEmbeddings
	from langchain.text_splitter import RecursiveCharacterTextSplitter
	from transformers import AutoModelForCausalLM, AutoTokenizer



	def respond_to_question(question, model, tokenizer):

	prompt = [{'role': 'user', 'content': question}]
	inputs = tokenizer.apply_chat_template(
	prompt,
	add_generation_prompt=True,
	return_tensors='pt'
	)

	tokens = model.generate(
	inputs.to(model.device),
	max_new_tokens=1024,
	temperature=0.8,
	do_sample=True
	)

	print(tokenizer.decode(tokens[0], skip_special_tokens=False))
	return tokenizer.decode(tokens[0], skip_special_tokens=False)
	# prompt = "write me a python function that prints the fibonacci sequence"
	# messages = [
	# {
	# "role": "system",
	# "content": "You are a friendly chatbot who can code",
	# },
	# {"role": "user", "content": prompt},
	# ]
	# prompt = pipe.tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
	# outputs = pipe(prompt, max_new_tokens=256, do_sample=True, temperature=0.7, top_k=50, top_p=0.95)
	# print(outputs[0]["generated_text"].split("<\|assistant\|>")[1])
	# return outputs[0]["generated_text"].split("<\|assistant\|>")[1]

	def main():
	st.title("LangChain Demo")

	tokenizer = AutoTokenizer.from_pretrained('stabilityai/stablelm-zephyr-3b')
	model = AutoModelForCausalLM.from_pretrained(
	'stabilityai/stablelm-zephyr-3b',
	trust_remote_code=True,
	device_map="auto"
	)

	if 'messages' not in st.session_state:
	st.session_state.messages = []

	prompt = st.text_input("Enter your question here:")

	for message in st.session_state.messages:
	st.chat_message(message['role']).markdown(message['text'])

	if prompt:
	st.session_state.messages.append({'role': 'user', 'text': prompt})
	st.chat_message("user").markdown(prompt)
	model_response = respond_to_question(prompt, model, tokenizer)
	st.session_state.messages.append({'role': 'Assistant', 'text': model_response})
	st.chat_message("system").markdown(model_response)

	if __name__ == "__main__":
	main()