Spaces:

luanpoppe
/

vella-backend

Sleeping

App Files Files Community

luanpoppe commited on Feb 17

Commit

753b4be

2 Parent(s): dc376b6 ce7daaf

Merge branch 'tests' of https://github.com/luanpoppe/vella-backend into feat-adicionar-google-gemini-2

Browse files

Files changed (7) hide show

README.md +5 -0
_utils/gerar_relatorio_modelo_usuario/GerarDocumento.py +45 -11
_utils/gerar_relatorio_modelo_usuario/utils.py +1 -1
_utils/resumo_completo_cursor.py +1 -1
gerar_documento/serializer.py +6 -6
gerar_documento/views.py +3 -3
requirements.txt +0 -0

README.md CHANGED Viewed

@@ -8,3 +8,8 @@ pinned: false
 ---
 Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

 ---
 Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference
+Dica de deploy no ambiente correto:
+git push <nome_do_remote> <branch_local>:<branch_do_remote>
+git push prd tests:main
+git push tests tests:main

_utils/gerar_relatorio_modelo_usuario/GerarDocumento.py CHANGED Viewed

@@ -36,7 +36,7 @@ class GerarDocumento:
         chunk_overlap,
         num_k_rerank,
         model_cohere_rerank,
-        prompt_auxiliar,
         gpt_model,
         gpt_temperature,
         # id_modelo_do_usuario,
@@ -45,7 +45,7 @@ class GerarDocumento:
     ):
         self.config = config
         self.logger = logging.getLogger(__name__)
-        self.prompt_auxiliar = prompt_auxiliar
         self.gpt_model = gpt_model
         self.gpt_temperature = gpt_temperature
         self.prompt_gerar_documento = prompt_gerar_documento
@@ -177,16 +177,50 @@ class GerarDocumento:
                 vector_store, bm25, chunk_ids, query
             )
-            llm = self.select_model_for_last_requests(llm_ultimas_requests)
-            prompt_auxiliar = PromptTemplate(
-                template=self.prompt_auxiliar, input_variables=["context"]
-            )
-            resumo_auxiliar_do_documento = llm.invoke(
-                prompt_auxiliar.format(context="\n\n".join(contexts))
-            )
-            self.resumo_gerado = cast(str, resumo_auxiliar_do_documento.content)
             prompt_gerar_documento = PromptTemplate(
                 template=self.prompt_gerar_documento,
@@ -197,8 +231,8 @@ class GerarDocumento:
                 str,
                 llm.invoke(
                     prompt_gerar_documento.format(
-                        documento_gerado=self.resumo_gerado,
                         context="\n\n".join(contexts),
                     )
                 ).content,
             )

         chunk_overlap,
         num_k_rerank,
         model_cohere_rerank,
+        # prompt_auxiliar,
         gpt_model,
         gpt_temperature,
         # id_modelo_do_usuario,
     ):
         self.config = config
         self.logger = logging.getLogger(__name__)
+        # self.prompt_auxiliar = prompt_auxiliar
         self.gpt_model = gpt_model
         self.gpt_temperature = gpt_temperature
         self.prompt_gerar_documento = prompt_gerar_documento
                 vector_store, bm25, chunk_ids, query
             )
+            # Prepare context and track sources
+            contexts = []
+            sources = []
+            # Get full documents for top results
+            for chunk_id, score in ranked_results[: self.config.num_chunks]:
+                results = vector_store.get(
+                    where={"chunk_id": chunk_id}, include=["documents", "metadatas"]
+                )
+                if results["documents"]:
+                    context = results["documents"][0]
+                    metadata = results["metadatas"][0]
+                    contexts.append(context)
+                    sources.append(
+                        {
+                            "content": context,
+                            "page": metadata["page"],
+                            "chunk_id": chunk_id,
+                            "relevance_score": score,
+                            "context": metadata.get("context", ""),
+                        }
+                    )
+            if llm_ultimas_requests == "gpt-4o-mini":
+                llm = ChatOpenAI(
+                    temperature=self.gpt_temperature,
+                    model=self.gpt_model,
+                    api_key=SecretStr(self.openai_api_key),
+                )
+            elif llm_ultimas_requests == "deepseek-chat":
+                llm_instance = LLM()
+                llm = llm_instance.deepseek()
+            # prompt_auxiliar = PromptTemplate(
+            #     template=self.prompt_auxiliar, input_variables=["context"]
+            # )
+            # resumo_auxiliar_do_documento = llm.invoke(
+            #     prompt_auxiliar.format(context="\n\n".join(contexts))
+            # )
+            # self.resumo_gerado = cast(str, resumo_auxiliar_do_documento.content)
             prompt_gerar_documento = PromptTemplate(
                 template=self.prompt_gerar_documento,
                 str,
                 llm.invoke(
                     prompt_gerar_documento.format(
                         context="\n\n".join(contexts),
+                        # modelo_usuario=serializer.data["modelo"],
                     )
                 ).content,
             )

_utils/gerar_relatorio_modelo_usuario/utils.py CHANGED Viewed

@@ -28,7 +28,7 @@ def gerar_resposta_compilada(serializer):
         "hf_embedding": serializer["hf_embedding"],
         "chunk_size": serializer["chunk_size"],
         "chunk_overlap": serializer["chunk_overlap"],
-        "prompt_auxiliar": serializer["prompt_auxiliar"],
         "prompt_gerar_documento": serializer["prompt_gerar_documento"],
     }

         "hf_embedding": serializer["hf_embedding"],
         "chunk_size": serializer["chunk_size"],
         "chunk_overlap": serializer["chunk_overlap"],
+        # "prompt_auxiliar": serializer["prompt_auxiliar"],
         "prompt_gerar_documento": serializer["prompt_gerar_documento"],
     }

_utils/resumo_completo_cursor.py CHANGED Viewed

@@ -66,7 +66,7 @@ async def get_llm_summary_answer_by_cursor_complete(
         chunk_size=serializer["chunk_size"],
         num_k_rerank=serializer["num_k_rerank"],
         model_cohere_rerank=serializer["model_cohere_rerank"],
-        prompt_auxiliar=serializer["prompt_auxiliar"],
         gpt_model=serializer["model"],
         gpt_temperature=serializer["gpt_temperature"],
         prompt_gerar_documento=serializer["prompt_gerar_documento"],

         chunk_size=serializer["chunk_size"],
         num_k_rerank=serializer["num_k_rerank"],
         model_cohere_rerank=serializer["model_cohere_rerank"],
+        # prompt_auxiliar=serializer["prompt_auxiliar"],
         gpt_model=serializer["model"],
         gpt_temperature=serializer["gpt_temperature"],
         prompt_gerar_documento=serializer["prompt_gerar_documento"],

gerar_documento/serializer.py CHANGED Viewed

@@ -22,9 +22,9 @@ class GerarDocumentoSerializer(ResumoCursorSerializer):
         required=False, default="version-test"
     )  # Será o valor utilizado dentro da URL da requisição pro Bubble
-    prompt_auxiliar = serializers.CharField(
-        required=False, default=prompt_auxiliar_padrao
-    )
     prompt_gerar_documento = serializers.CharField(
         required=False, default=prompt_gerar_documento
     )
@@ -53,9 +53,9 @@ class GerarDocumentoSerializer(ResumoCursorSerializer):
 class GerarDocumentoComPDFProprioSerializer(ResumoCursorSerializer):
     system_prompt = None
-    prompt_auxiliar = serializers.CharField(
-        required=False, default=prompt_auxiliar_padrao
-    )
     prompt_gerar_documento = serializers.CharField(
         required=False, default=prompt_gerar_documento
     )

         required=False, default="version-test"
     )  # Será o valor utilizado dentro da URL da requisição pro Bubble
+    # prompt_auxiliar = serializers.CharField(
+    #     required=False, default=prompt_auxiliar_padrao
+    # )
     prompt_gerar_documento = serializers.CharField(
         required=False, default=prompt_gerar_documento
     )
 class GerarDocumentoComPDFProprioSerializer(ResumoCursorSerializer):
     system_prompt = None
+    # prompt_auxiliar = serializers.CharField(
+    #     required=False, default=prompt_auxiliar_padrao
+    # )
     prompt_gerar_documento = serializers.CharField(
         required=False, default=prompt_gerar_documento
     )

gerar_documento/views.py CHANGED Viewed

@@ -33,9 +33,9 @@ class GerarDocumentoView(AsyncAPIView):
             data = cast(Dict[str, Any], serializer.validated_data)
             print("\n\ndata: ", data)
-            data["prompt_auxiliar"] = (
-                prompt_auxiliar_inicio + "\n" + data["prompt_auxiliar"]
-            )
             # listaPDFs = handle_pdf_files_from_serializer(data["files"])
             listaPDFs = [l["link_arquivo"] for l in data["files"]]

             data = cast(Dict[str, Any], serializer.validated_data)
             print("\n\ndata: ", data)
+            # data["prompt_auxiliar"] = (
+            #     prompt_auxiliar_inicio + "\n" + data["prompt_auxiliar"]
+            # )
             # listaPDFs = handle_pdf_files_from_serializer(data["files"])
             listaPDFs = [l["link_arquivo"] for l in data["files"]]

requirements.txt CHANGED Viewed

Binary files a/requirements.txt and b/requirements.txt differ