Spaces:

Daoneeee
/

task_Chatbot

Sleeping

Daoneeee commited on Nov 21, 2023

Commit

df187da

1 Parent(s): 230406f

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -14,6 +14,7 @@ from langchain.document_loaders import PyPDFLoader, TextLoader, JSONLoader, CSVL
 import tempfile # 임시 파일을 생성하기 위한 라이브러리입니다.
 import json
 import os
@@ -66,17 +67,19 @@ def get_json_file(json_docs):
         return [json_string]
 # 문서들을 처리하여 텍스트 청크로 나누는 함수입니다.
 def get_text_chunks(documents):
     text_splitter = RecursiveCharacterTextSplitter(
         chunk_size=1000,  # 청크의 크기를 지정합니다.
         chunk_overlap=200,  # 청크 사이의 중복을 지정합니다.
         length_function=len  # 텍스트의 길이를 측정하는 함수를 지정합니다.
     )
-    documents = text_splitter.split_documents(documents)  # 문서들을 청크로 나눕니다
-    return documents  # 나눈 청크를 반환합니다.
 # 텍스트 청크들로부터 벡터 스토어를 생성하는 함수입니다.
 def get_vectorstore(text_chunks):

 import tempfile # 임시 파일을 생성하기 위한 라이브러리입니다.
 import json
 import os
+from langchain.text_splitter import RecursiveCharacterTextSplitter
         return [json_string]
 # 문서들을 처리하여 텍스트 청크로 나누는 함수입니다.
 def get_text_chunks(documents):
+    # RecursiveCharacterTextSplitter를 직접 초기화합니다.
     text_splitter = RecursiveCharacterTextSplitter(
         chunk_size=1000,  # 청크의 크기를 지정합니다.
         chunk_overlap=200,  # 청크 사이의 중복을 지정합니다.
         length_function=len  # 텍스트의 길이를 측정하는 함수를 지정합니다.
     )
+    # 문서를 청크로 나눕니다.
+    text_chunks = text_splitter.split_text(documents)
+    return text_chunks
 # 텍스트 청크들로부터 벡터 스토어를 생성하는 함수입니다.
 def get_vectorstore(text_chunks):