Spaces:

iShare
/

Langchain-Summarization-Chain

Sleeping

iShare commited on Dec 7, 2023

Commit

3e04659

1 Parent(s): a20e394

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -31,12 +31,12 @@ llm = HuggingFaceHub(repo_id=repo_id,  # for StarChat
 chain = load_summarize_chain(llm, chain_type="refine")
-text_splitter_rcs = RecursiveCharacterTextSplitter(
-    #separator = "\n", #TypeError: TextSplitter.__init__() got an unexpected keyword argument 'separator'
-    chunk_size = 500,
-    chunk_overlap  = 100, #striding over the text
-    length_function = len,
-    )
 #llm = ChatOpenAI(temperature=0, model_name="gpt-3.5-turbo-16k")
@@ -49,11 +49,11 @@ if url !="" and not url.strip().isspace() and not url == "" and not url.strip()
             print("Website to Chat: "+url)
             loader = WebBaseLoader(url)
             docs = loader.load()
-            split_docs = text_splitter_rcs.split_documents(docs)
-            print(split_docs)
             print()
-            #result=chain.run(docs)   #这个result的格式比较特殊，可以直接print，但不可以和其他字符串联合print输出 - this step errors!
-            result=chain.run(split_docs)   #找到之前总是POST Error的原因：chain.run(docs)的结果，格式不是str，导致程序错误
             result=str(result)
             cleaned_initial_ai_response = remove_context(result)
             print(cleaned_initial_ai_response)

 chain = load_summarize_chain(llm, chain_type="refine")
+#text_splitter_rcs = RecursiveCharacterTextSplitter(
+#    #separator = "\n", #TypeError: TextSplitter.__init__() got an unexpected keyword argument 'separator'
+#    chunk_size = 500,
+#    chunk_overlap  = 100, #striding over the text
+#    length_function = len,
+#    )
 #llm = ChatOpenAI(temperature=0, model_name="gpt-3.5-turbo-16k")
             print("Website to Chat: "+url)
             loader = WebBaseLoader(url)
             docs = loader.load()
+            #split_docs = text_splitter_rcs.split_documents(docs)
+            #print(split_docs)
             print()
+            result=chain.run(docs)   #这个result的格式比较特殊，可以直接print，但不可以和其他字符串联合print输出 - this step errors!
+            #result=chain.run(split_docs)   #找到之前总是POST Error的原因：chain.run(docs)的结果，格式不是str，导致程序错误
             result=str(result)
             cleaned_initial_ai_response = remove_context(result)
             print(cleaned_initial_ai_response)