Spaces:

bupa1018
/

KadiAPY_Coding_Assistant

Sleeping

bupa1018 commited on Mar 9

Commit

0114c32

1 Parent(s): ebfd153

Update chunk_python_code.py

Files changed (1) hide show

chunk_python_code.py CHANGED Viewed

@@ -63,7 +63,7 @@ def _iterate_ast(python_code, documents, file_path):
                 _chunk_first_level_assign_node(first_level_node, documents, python_code))
         else:
             documents.extend(
-                _handle_notdefined_case(python_code))
 def _chunk_import_only_python_code(python_code, file_path):
@@ -89,34 +89,12 @@ def _chunk_import_only_python_code(python_code, file_path):
-def _handle_notdefined_case(python_code):
     documents = []
     documents.extend(
-        _chunk_python_code_by_character)
     return documents
-from langchain.text_splitter import RecursiveCharacterTextSplitter
-def _chunk_python_code_by_character(python_code):
-    documents = []
-    text_splitter = RecursiveCharacterTextSplitter(
-        chunk_size=512,
-        chunk_overlap=128,
-        separators=[]
-    )
-    chunks = text_splitter.split_text(python_code)
-    for chunk in chunks:
-        doc = Document(
-            page_content=chunk
-        )
-        documents.append(doc)
-    return documents
 def _chunk_nodeless_python_code(python_code, file_path):
     """
@@ -245,4 +223,26 @@ def _chunk_first_level_func_node(ast_node, python_code):
     )
     documents.append(doc)
     return documents

                 _chunk_first_level_assign_node(first_level_node, documents, python_code))
         else:
             documents.extend(
+                _handle_not_defined_case(python_code))
 def _chunk_import_only_python_code(python_code, file_path):
+def _handle_not_defined_case(python_code):
     documents = []
     documents.extend(
+        _chunk_python_code_by_character(python_code)
     return documents
 def _chunk_nodeless_python_code(python_code, file_path):
     """
     )
     documents.append(doc)
+    return documents
+from langchain.text_splitter import RecursiveCharacterTextSplitter
+def _chunk_python_code_by_character(python_code):
+    documents = []
+    text_splitter = RecursiveCharacterTextSplitter(
+        chunk_size=512,
+        chunk_overlap=128,
+        separators=[]
+    )
+    chunks = text_splitter.split_text(python_code)
+    for chunk in chunks:
+        doc = Document(
+            page_content=chunk
+        )
+        documents.append(doc)
     return documents