Spaces:

Sasidhar
/

ml-playground

Runtime error

App Files Files Community

Sasidhar commited on Apr 26, 2023

Commit

ae9c1ea

1 Parent(s): 9ebe00e

Update app.py

Browse files

Files changed (1) hide show

app.py +28 -61

app.py CHANGED Viewed

@@ -1,75 +1,42 @@
-import os
-#os.system('pip install detectron2 -f https://dl.fbaipublicfiles.com/detectron2/wheels/cu102/torch1.9/index.html')
-import transformers
 import streamlit as st
-from transformers import AutoTokenizer, AutoModelWithLMHead
-from transformers import pipeline
-sentiment_tokenizer = AutoTokenizer.from_pretrained("mrm8488/t5-base-finetuned-imdb-sentiment")
-def load_text_gen_model():
-    generator = pipeline("text-generation", model="gpt2-medium")
-    return generator
-@st.cache
-def get_sentiment_model():
-    sentiment_model = AutoModelWithLMHead.from_pretrained("mrm8488/t5-base-finetuned-imdb-sentiment")
-    return sentiment_model
-def get_summarizer_model():
-    summarizer = pipeline("summarization", model="facebook/bart-large-cnn")
-    return summarizer
-def get_sentiment(text):
-    input_ids = sentiment_tokenizer .encode(text + '</s>', return_tensors='pt')
-    output = sentiment_extractor.generate(input_ids=input_ids,max_length=2)
-    dec = [sentiment_tokenizer.decode(ids) for ids in output]
-    label = dec[0]
-    return label
-def get_qa_model():
-    model_name = "deepset/roberta-base-squad2"
-    qa_pipeline = pipeline('question-answering', model=model_name, tokenizer=model_name)
-    return qa_pipeline
-sentiment_extractor   = get_sentiment_model()
-summarizer = get_summarizer_model()
-answer_generator = get_qa_model()
-st.header("Review Analyzer")
-#action = st.sidebar.selectbox("Pick an Action", ["Analyse a Review","Generate an Article","Create an Image"])
-#if action == "Analyse a Review":
-st.subheader("Paste/write a review here..")
-review = st.text_area("")
-if review:
-    start_sentiment_analysis = st.button("Get the Sentiment of the Review")
-    start_summarizing = st.button("Summarize the review")
-    start_topic_extraction = st.button("Find the key topic")
-    if start_sentiment_analysis:
-        sentiment = get_sentiment(review)
-        st.write(sentiment)
-    if start_summarizing:
-        summary = summarizer(review, max_length=130, min_length=30, do_sample=False)
-        st.write(summary)
-    if start_topic_extraction:
-        QA_input = {'question': 'what is the review about?',
-                    'context': review}
-        answer = answer_generator(QA_input)
-        st.write(answer)

+import os
+import openai
+import pinecone
+from langchain.document_loaders import DirectoryLoader
+from langchain.text_splitter import RecursiveCharacterTextSplitter
+from langchain.embeddings.openai import OpenAIEmbeddings
+from langchain.vectorstores import Pinecone
+from langchain.llms import OpenAI
+from langchain.chains.question_answering import load_qa_chain
 import streamlit as st
+st.header("Document Question Answering")
+directory = st.text_area("")
+#directory = '/content/data'
+def load_docs(directory):
+  loader = DirectoryLoader(directory)
+  documents = loader.load()
+  return documents
+def split_docs(documents, chunk_size=1000, chunk_overlap=20):
+  text_splitter = RecursiveCharacterTextSplitter(chunk_size=chunk_size, chunk_overlap=chunk_overlap)
+  docs = text_splitter.split_documents(documents)
+  return docs
+if directory:
+    documents = load_docs(directory)
+    st.write(len(documents))
+    docs = split_docs(documents)
+    print(len(docs))
+    embeddings = OpenAIEmbeddings(model_name="ada")
+    query_result = embeddings.embed_query("Hello world")
+    st.write(len(query_result))