Spaces:

Daoneeee
/

task_Chatbot

Sleeping

App Files Files Community

Daoneeee commited on Nov 21, 2023

Commit

3a75faa

1 Parent(s): df187da

Update app.py

Browse files

Files changed (1) hide show

app.py +7 -19

app.py CHANGED Viewed

@@ -11,12 +11,8 @@ from langchain.chains import ConversationalRetrievalChain
 from htmlTemplates import css, bot_template, user_template
 from langchain.llms import HuggingFaceHub, LlamaCpp, CTransformers  # For loading transformer models.
 from langchain.document_loaders import PyPDFLoader, TextLoader, JSONLoader, CSVLoader
-import tempfile # 임시 파일을 생성하기 위한 라이브러리입니다.
-import json
 import os
-from langchain.text_splitter import RecursiveCharacterTextSplitter
 # PDF 문서로부터 텍스트를 추출하는 함수입니다.
@@ -51,35 +47,27 @@ def get_csv_file(csv_docs):
     csv_doc = csv_loader.load()
     return csv_doc
 def get_json_file(json_docs):
     temp_dir = tempfile.TemporaryDirectory()
     temp_filepath = os.path.join(temp_dir.name, json_docs.name)
     with open(temp_filepath, "wb") as f:
         f.write(json_docs.getvalue())
-    # 파일을 열어 JSON 형식으로 읽기
-    with open(temp_filepath, 'r', encoding='utf-8') as json_file:
-        json_content = json.load(json_file)
-        # JSON 데이터를 문자열로 변환
-        json_string = json.dumps(json_content)
-        # 변환된 문자열을 리스트에 담아 반환
-        return [json_string]
 # 문서들을 처리하여 텍스트 청크로 나누는 함수입니다.
 def get_text_chunks(documents):
-    # RecursiveCharacterTextSplitter를 직접 초기화합니다.
     text_splitter = RecursiveCharacterTextSplitter(
         chunk_size=1000,  # 청크의 크기를 지정합니다.
         chunk_overlap=200,  # 청크 사이의 중복을 지정합니다.
         length_function=len  # 텍스트의 길이를 측정하는 함수를 지정합니다.
     )
-    # 문서를 청크로 나눕니다.
-    text_chunks = text_splitter.split_text(documents)
-    return text_chunks
 # 텍스트 청크들로부터 벡터 스토어를 생성하는 함수입니다.
 def get_vectorstore(text_chunks):

 from htmlTemplates import css, bot_template, user_template
 from langchain.llms import HuggingFaceHub, LlamaCpp, CTransformers  # For loading transformer models.
 from langchain.document_loaders import PyPDFLoader, TextLoader, JSONLoader, CSVLoader
+import tempfile  # 임시 파일을 생성하기 위한 라이브러리입니다.
 import os
 # PDF 문서로부터 텍스트를 추출하는 함수입니다.
     csv_doc = csv_loader.load()
     return csv_doc
 def get_json_file(json_docs):
     temp_dir = tempfile.TemporaryDirectory()
     temp_filepath = os.path.join(temp_dir.name, json_docs.name)
     with open(temp_filepath, "wb") as f:
         f.write(json_docs.getvalue())
+    json_loader = JSONLoader(temp_filepath)
+    json_doc = json_loader.load()
+    return json_doc
 # 문서들을 처리하여 텍스트 청크로 나누는 함수입니다.
 def get_text_chunks(documents):
     text_splitter = RecursiveCharacterTextSplitter(
         chunk_size=1000,  # 청크의 크기를 지정합니다.
         chunk_overlap=200,  # 청크 사이의 중복을 지정합니다.
         length_function=len  # 텍스트의 길이를 측정하는 함수를 지정합니다.
     )
+    documents = text_splitter.split_documents(documents)  # 문서들을 청크로 나눕니다
+    return documents  # 나눈 청크를 반환합니다.
 # 텍스트 청크들로부터 벡터 스토어를 생성하는 함수입니다.
 def get_vectorstore(text_chunks):