Spaces:

luanpoppe
/

vella-backend

Running

App Files Files Community

luanpoppe commited on Feb 18

Commit

0f952b3

1 Parent(s): e1d2a79

feat: adicionando prints para facilitar o debug

Browse files

Files changed (6) hide show

_utils/gerar_relatorio_modelo_usuario/contextual_retriever.py +2 -0
_utils/gerar_relatorio_modelo_usuario/utils.py +4 -1
_utils/handle_files.py +1 -0
_utils/resumo_completo_cursor.py +4 -2
_utils/splitters/Splitter_class.py +6 -0
gerar_documento/views.py +3 -2

_utils/gerar_relatorio_modelo_usuario/contextual_retriever.py CHANGED Viewed

@@ -73,7 +73,9 @@ class ContextualRetriever:
                 print(
                     f"\n\nTENTATIVA FORMATAÇÃO CHUNKS NÚMERO {attempt}: {all_chunks_contents[0:500]}"
                 )
                 raw_response = await agpt_answer(prompt)
                 response = cast(str, raw_response)
                 # llms = LLM()
                 # response = await llms.deepseek().ainvoke([HumanMessage(content=prompt)])

                 print(
                     f"\n\nTENTATIVA FORMATAÇÃO CHUNKS NÚMERO {attempt}: {all_chunks_contents[0:500]}"
                 )
+                print("\nCOMEÇANDO UMA REQUISIÇÃO DO CONTEXTUAL")
                 raw_response = await agpt_answer(prompt)
+                print("\nTERMINOU UMA REQUISIÇÃO DO CONTEXTUAL")
                 response = cast(str, raw_response)
                 # llms = LLM()
                 # response = await llms.deepseek().ainvoke([HumanMessage(content=prompt)])

_utils/gerar_relatorio_modelo_usuario/utils.py CHANGED Viewed

@@ -72,9 +72,10 @@ async def get_response_from_auxiliar_contextual_prompt(full_text_as_array: List[
     for x in full_text_as_array:
         full_text += x
     prompt_auxiliar_summary = create_prompt_auxiliar_do_contextual_prompt(full_text)
-    print("\n\n\nprompt_auxiliar_summary[0:500]: ", prompt_auxiliar_summary[0:500])
     # Claude comentado pois o limite de tokens estava sendo passado pela requisição e dava erro
     # response_auxiliar_summary = await aclaude_answer(
@@ -82,9 +83,11 @@ async def get_response_from_auxiliar_contextual_prompt(full_text_as_array: List[
     # )
     llms = LLM()
     response_auxiliar_summary = await llms.google_gemini().ainvoke(
         [HumanMessage(content=prompt_auxiliar_summary)]
     )
     print(
         "\n\n\n\nresponse_auxiliar_summary.content[0:500]: ",

     for x in full_text_as_array:
         full_text += x
+    print("\nCRIANDO PROMPT AUXILIAR DO CONTEXTUAL")
     prompt_auxiliar_summary = create_prompt_auxiliar_do_contextual_prompt(full_text)
+    print("\n\nprompt_auxiliar_summary[0:500]: ", prompt_auxiliar_summary[0:500])
     # Claude comentado pois o limite de tokens estava sendo passado pela requisição e dava erro
     # response_auxiliar_summary = await aclaude_answer(
     # )
     llms = LLM()
+    print("\nCOMEÇANDO REQUISIÇÃO AUXILIAR DO CONTEXTUAL")
     response_auxiliar_summary = await llms.google_gemini().ainvoke(
         [HumanMessage(content=prompt_auxiliar_summary)]
     )
+    print("\nTERMINOU REQUISIÇÃO AUXILIAR DO CONTEXTUAL")
     print(
         "\n\n\n\nresponse_auxiliar_summary.content[0:500]: ",

_utils/handle_files.py CHANGED Viewed

@@ -28,6 +28,7 @@ def handle_pdf_files_from_serializer(files):
 def remove_pdf_temp_files(listaPDFs):
     for file in listaPDFs:
         os.remove(file)

 def remove_pdf_temp_files(listaPDFs):
+    print("\nREMOVENDO ARQUIVOS PDF TEMPORÁRIOS")
     for file in listaPDFs:
         os.remove(file)

_utils/resumo_completo_cursor.py CHANGED Viewed

@@ -84,9 +84,11 @@ async def get_llm_summary_answer_by_cursor_complete(
             full_text_as_array
         )
         contextualized_chunks = await contextual_retriever.contextualize_all_chunks(
             all_PDFs_chunks, response_auxiliar_summary
         )
         chunks_processados = contextualized_chunks
     else:
         chunks_processados = all_PDFs_chunks
@@ -100,9 +102,11 @@ async def get_llm_summary_answer_by_cursor_complete(
     llm_ultimas_requests = serializer["llm_ultimas_requests"]
     # Generate enhanced summary
     structured_summaries = await summarizer.gerar_documento_final(
         vector_store, bm25, chunk_ids, llm_ultimas_requests, prompt_auxiliar_SEM_CONTEXT
     )
     if not isinstance(structured_summaries, list):
         from rest_framework.response import Response
@@ -114,8 +118,6 @@ async def get_llm_summary_answer_by_cursor_complete(
     for x in structured_summaries:
         texto_completo = texto_completo + x["content"] + "\n"
-    print("\n\ntexto_completo[0: 1000]: ", texto_completo[0:1000])
     return {
         "resultado": structured_summaries,
         "texto_completo": texto_completo,

             full_text_as_array
         )
+        print("\nCOMEÇANDO A FAZER AS REQUISIÇÕES DO CONTEXTUAL")
         contextualized_chunks = await contextual_retriever.contextualize_all_chunks(
             all_PDFs_chunks, response_auxiliar_summary
         )
+        print("\nTERMINOU DE FAZER TODAS AS REQUISIÇÕES DO CONTEXTUAL")
         chunks_processados = contextualized_chunks
     else:
         chunks_processados = all_PDFs_chunks
     llm_ultimas_requests = serializer["llm_ultimas_requests"]
     # Generate enhanced summary
+    print("\nCOMEÇANDO A FAZER ÚLTIMA REQUISIÇÃO")
     structured_summaries = await summarizer.gerar_documento_final(
         vector_store, bm25, chunk_ids, llm_ultimas_requests, prompt_auxiliar_SEM_CONTEXT
     )
+    print("\nTERMINOU DE FAZER A ÚLTIMA REQUISIÇÃO")
     if not isinstance(structured_summaries, list):
         from rest_framework.response import Response
     for x in structured_summaries:
         texto_completo = texto_completo + x["content"] + "\n"
     return {
         "resultado": structured_summaries,
         "texto_completo": texto_completo,

_utils/splitters/Splitter_class.py CHANGED Viewed

@@ -33,6 +33,7 @@ class Splitter:
         initial_chunks: List[str] = []
         if isBubble:
             pages = await get_pdf_from_bubble(pdf_path, should_use_llama_parse)
             page_boundaries, combined_text = (
                 combine_documents_without_losing_pagination(pages)
@@ -42,6 +43,7 @@ class Splitter:
             )
         else:
             if should_use_llama_parse:
                 pages = await return_document_list_with_llama_parser(pdf_path)
                 page_boundaries, combined_text = (
                     combine_documents_without_losing_pagination(pages)
@@ -50,7 +52,9 @@ class Splitter:
                     combined_text
                 )
             else:
                 pages = PyPDFLoader(pdf_path).load()
                 page_boundaries, combined_text = (
                     combine_documents_without_losing_pagination(pages)
                 )
@@ -68,6 +72,7 @@ class Splitter:
         #         text
         #     )  # Quebra o item que é um Document de UMA PÁGINA inteira em um lista onde cada item é referente a um chunk, que são pedaços menores do que uma página.
         text_char = 0
         for chunk in initial_chunks:
             chunk_id = str(uuid.uuid4())
             start_char = text_char + 1
@@ -103,6 +108,7 @@ class Splitter:
             }
             # char_count += len(text)
         return chunks, initial_chunks

         initial_chunks: List[str] = []
         if isBubble:
+            print("\nPEGANDO PDF DO BUBBLE")
             pages = await get_pdf_from_bubble(pdf_path, should_use_llama_parse)
             page_boundaries, combined_text = (
                 combine_documents_without_losing_pagination(pages)
             )
         else:
             if should_use_llama_parse:
+                print("\nENVIANDO PDFS PARA LLAMA PARSE")
                 pages = await return_document_list_with_llama_parser(pdf_path)
                 page_boundaries, combined_text = (
                     combine_documents_without_losing_pagination(pages)
                     combined_text
                 )
             else:
+                print("\nCOMEÇANDO LEITURA DO PDF")
                 pages = PyPDFLoader(pdf_path).load()
+                print("\nTERMINOU LEITURA DO PDF")
                 page_boundaries, combined_text = (
                     combine_documents_without_losing_pagination(pages)
                 )
         #         text
         #     )  # Quebra o item que é um Document de UMA PÁGINA inteira em um lista onde cada item é referente a um chunk, que são pedaços menores do que uma página.
         text_char = 0
+        print("\QUEBRANDO PDF EM CHUNKS ORGANIZADOS")
         for chunk in initial_chunks:
             chunk_id = str(uuid.uuid4())
             start_char = text_char + 1
             }
             # char_count += len(text)
+            print("\nTERMINOU DE ORGANIZAR PDFS EM CHUNKS")
         return chunks, initial_chunks

gerar_documento/views.py CHANGED Viewed

@@ -31,7 +31,7 @@ class GerarDocumentoView(AsyncAPIView):
             if not serializer.validated_data:
                 raise ValueError("Erro no validated_data")
             data = cast(Dict[str, Any], serializer.validated_data)
-            print("\n\ndata: ", data)
             # data["prompt_auxiliar"] = (
             #     prompt_auxiliar_inicio + "\n" + data["prompt_auxiliar"]
@@ -49,6 +49,7 @@ class GerarDocumentoView(AsyncAPIView):
             # remove_pdf_temp_files(listaPDFs)
             return Response({"resposta": resposta_llm})
@@ -73,5 +74,5 @@ class GerarDocumentoComPDFProprioView(AsyncAPIView):
             print("\n\nresposta_llm: ", resposta_llm)
             remove_pdf_temp_files(listaPDFs)
             return Response({"resposta": resposta_llm})

             if not serializer.validated_data:
                 raise ValueError("Erro no validated_data")
             data = cast(Dict[str, Any], serializer.validated_data)
+            print("\ndata: ", data)
             # data["prompt_auxiliar"] = (
             #     prompt_auxiliar_inicio + "\n" + data["prompt_auxiliar"]
             # remove_pdf_temp_files(listaPDFs)
+            print("PRÓXIMA LINHA ENVIA A RESPOSTA A QUEM FEZ A REQUISIÇÃO")
             return Response({"resposta": resposta_llm})
             print("\n\nresposta_llm: ", resposta_llm)
             remove_pdf_temp_files(listaPDFs)
+            print("PRÓXIMA LINHA ENVIA A RESPOSTA A QUEM FEZ A REQUISIÇÃO")
             return Response({"resposta": resposta_llm})