Spaces:

Cesar42
/

PreguntasDocumentos

Running

App Files Files Community

Cesar42 commited on Mar 11

Commit

3211123

verified ·

1 Parent(s): c66ddb2

Upload 2 files

Browse files

Files changed (2) hide show

app.py +59 -16
requirements.txt +1 -1

app.py CHANGED Viewed

@@ -11,9 +11,23 @@ from langchain.prompts import PromptTemplate
 st.set_page_config(page_title='preguntaDOC')
 st.header("Pregunta a tu PDF")
-# Campo para el token de Hugging Face (ahora requerido para los embeddings)
 huggingface_api_token = st.text_input('Hugging Face API Token (requerido)', type='password')
 pdf_obj = st.file_uploader("Carga tu documento", type="pdf", on_change=st.cache_resource.clear)
 @st.cache_resource
@@ -36,8 +50,7 @@ def create_embeddings(pdf, api_token):
     )
     chunks = text_splitter.split_text(text)
-    # Usar HuggingFaceHubEmbeddings en lugar de HuggingFaceEmbeddings
-    # Este enfoque no requiere sentence-transformers instalado localmente
     embeddings = HuggingFaceHubEmbeddings(
         repo_id="sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2",
         huggingfacehub_api_token=api_token
@@ -55,22 +68,51 @@ if pdf_obj and huggingface_api_token:
         if user_question:
             docs = knowledge_base.similarity_search(user_question, 3)
-            # Usar un modelo gratuito de Hugging Face
             llm = HuggingFaceHub(
-                repo_id="bigscience/bloom-560m",
                 huggingfacehub_api_token=huggingface_api_token,
-                model_kwargs={"temperature": 0.5, "max_length": 512}
             )
-            prompt_template = """
-            Responde a la siguiente pregunta basándote únicamente en el contexto proporcionado.
-            Contexto: {context}
-            Pregunta: {question}
-            Respuesta:
-            """
             PROMPT = PromptTemplate(
                 template=prompt_template,
@@ -79,11 +121,12 @@ if pdf_obj and huggingface_api_token:
             chain = load_qa_chain(llm, chain_type="stuff", prompt=PROMPT)
-            with st.spinner("Procesando tu pregunta..."):
                 try:
                     respuesta = chain.run(input_documents=docs, question=user_question)
                     st.write(respuesta)
                 except Exception as e:
                     st.error(f"Error al procesar tu pregunta: {str(e)}")
 elif not huggingface_api_token and pdf_obj:
     st.warning("Por favor, ingresa tu token de API de Hugging Face para continuar.")

 st.set_page_config(page_title='preguntaDOC')
 st.header("Pregunta a tu PDF")
+# Campo para el token de Hugging Face
 huggingface_api_token = st.text_input('Hugging Face API Token (requerido)', type='password')
+# Selección de modelo
+modelo_options = {
+    "Google FLAN-T5 Small": "google/flan-t5-small",
+    "Google FLAN-T5 Base": "google/flan-t5-base",
+    "BLOOM 560M": "bigscience/bloom-560m",
+    "BLOOM 1.1B": "bigscience/bloom-1b1",
+    "Falcon 7B Instruct": "tiiuae/falcon-7b-instruct",
+    "Gemma 2B": "google/gemma-2b",
+    "Gemma 2B Instruct": "google/gemma-2b-it"
+}
+selected_model = st.selectbox("Selecciona un modelo:", list(modelo_options.keys()))
+modelo_id = modelo_options[selected_model]
 pdf_obj = st.file_uploader("Carga tu documento", type="pdf", on_change=st.cache_resource.clear)
 @st.cache_resource
     )
     chunks = text_splitter.split_text(text)
+    # Usar HuggingFaceHubEmbeddings
     embeddings = HuggingFaceHubEmbeddings(
         repo_id="sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2",
         huggingfacehub_api_token=api_token
         if user_question:
             docs = knowledge_base.similarity_search(user_question, 3)
+            # Configurar los parámetros del modelo según el tipo
+            model_kwargs = {}
+            # Verificar el tipo de modelo para usar los parámetros adecuados
+            if "flan-t5" in modelo_id:
+                model_kwargs = {"temperature": 0.5, "max_length": 512}
+            elif "bloom" in modelo_id:
+                model_kwargs = {"temperature": 0.7, "max_length": 512}
+            elif "falcon" in modelo_id or "llama" in modelo_id or "gemma" in modelo_id:
+                model_kwargs = {"temperature": 0.1, "max_new_tokens": 512}
+            else:
+                model_kwargs = {"temperature": 0.5, "max_length": 512}
+            # Crear el LLM con los parámetros adecuados
             llm = HuggingFaceHub(
+                repo_id=modelo_id,
                 huggingfacehub_api_token=huggingface_api_token,
+                model_kwargs=model_kwargs
             )
+            # Prompt diferente según el tipo de modelo
+            if "falcon" in modelo_id or "llama" in modelo_id or "gemma" in modelo_id:
+                prompt_template = """
+                <|system|>
+                Responde a la siguiente pregunta basándote únicamente en el contexto proporcionado.
+                </|system|>
+                <|user|>
+                Contexto: {context}
+                Pregunta: {question}
+                </|user|>
+                <|assistant|>
+                """
+            else:
+                prompt_template = """
+                Responde a la siguiente pregunta basándote únicamente en el contexto proporcionado.
+                Contexto: {context}
+                Pregunta: {question}
+                Respuesta:
+                """
             PROMPT = PromptTemplate(
                 template=prompt_template,
             chain = load_qa_chain(llm, chain_type="stuff", prompt=PROMPT)
+            with st.spinner(f"Procesando tu pregunta con {selected_model}..."):
                 try:
                     respuesta = chain.run(input_documents=docs, question=user_question)
                     st.write(respuesta)
                 except Exception as e:
                     st.error(f"Error al procesar tu pregunta: {str(e)}")
+                    st.info("Sugerencia: Intenta con un modelo diferente. Algunos modelos pueden requerir más recursos o tener limitaciones específicas.")
 elif not huggingface_api_token and pdf_obj:
     st.warning("Por favor, ingresa tu token de API de Hugging Face para continuar.")

requirements.txt CHANGED Viewed

@@ -8,4 +8,4 @@ faiss-cpu==1.7.4
 accelerate==0.20.3
 einops==0.6.1
 protobuf==3.20.3
-tiktoken==0.4.0

 accelerate==0.20.3
 einops==0.6.1
 protobuf==3.20.3
+tiktoken==0.4.0