Spaces:

JaphetHernandez
/

PotentialTalents_2

Sleeping

App Files Files Community

JaphetHernandez commited on Oct 23, 2024

Commit

1860099

verified ·

1 Parent(s): bb4b951

Update app.py

Browse files

Files changed (1) hide show

app.py +36 -23

app.py CHANGED Viewed

@@ -1,34 +1,47 @@
-import torch
-import pandas as pd
 import streamlit as st
-import transformers
-from transformers import AutoModelForCausalLM, AutoTokenizer
-from huggingface_hub import login
-# Tu token secreto de Hugging Face
-huggingface_token = st.secrets["HUGGINGFACEHUB_API_TOKEN"]
-login(huggingface_token)
-# Solicitar la subida de un archivo CSV
 uploaded_file = st.file_uploader("Sube un archivo CSV", type=["csv"])
 if uploaded_file is not None:
-    # Leer el archivo CSV y mostrar una vista previa
     df = pd.read_csv(uploaded_file)
     st.write("Vista previa del archivo CSV:", df.head())
-    model_name = "meta-llama/llama-3.1-8b-instruct"  # Reemplaza con el modelo que quieras usar
-    model = AutoModelForCausalLM.from_pretrained(model_name, token=huggingface_token, torch_dtype=torch.float16)
-    tokenizer = AutoTokenizer.from_pretrained(model_name, token=huggingface_token)
-    # Solicita un query al usuario
-    query = st.text_input("Por favor ingresa tu consulta:")
-    if query:
-        # Tokeniza el input y genera una respuesta
-        inputs = tokenizer(query, return_tensors="pt")
-        outputs = model.generate(**inputs)
-        # Decodifica y muestra la respuesta
-        response = tokenizer.decode(outputs[0], skip_special_tokens=True)
-        st.write("Respuesta del modelo:", response)

 import streamlit as st
+import pandas as pd
+from langchain.prompts import PromptTemplate
+from langchain.llms import OpenAI
+# Cargar archivo CSV
 uploaded_file = st.file_uploader("Sube un archivo CSV", type=["csv"])
 if uploaded_file is not None:
+    # Leer el archivo CSV
     df = pd.read_csv(uploaded_file)
     st.write("Vista previa del archivo CSV:", df.head())
+    if 'job_title' in df.columns:
+        # Preguntar al usuario por el query
+        query = st.text_input("Por favor ingresa tu consulta para calcular similitud de coseno:")
+        if query:
+            # Crear el prompt para el modelo, dándole instrucciones detalladas
+            prompt_template = """
+            Tienes un archivo CSV con la columna 'job_title'. Tu tarea es calcular el puntaje de similitud de coseno entre cada registro de 'job_title' y el siguiente query: '{query}'.
+            Necesitas crear una nueva columna 'Score' que contenga los puntajes de similitud para cada registro.
+            Luego, debes ordenar los registros de mayor a menor según el valor en la columna 'Score'.
+            Devuélveme el DataFrame resultante con los registros ordenados.
+            Aquí tienes los datos de la columna 'job_title':
+            {job_titles}
+            """
+            # Convertir los títulos de trabajo a una lista
+            job_titles = df['job_title'].tolist()
+            # Formatear el prompt con el query y los job_titles
+            prompt = PromptTemplate(
+                template=prompt_template,
+                input_variables=["query", "job_titles"]
+            ).format(query=query, job_titles=job_titles)
+            # Llamar al modelo de lenguaje usando LangChain y OpenAI
+            llm = OpenAI(temperature=0.7)  # Llama a GPT u otro LLM
+            response = llm(prompt)
+            # Mostrar la respuesta del modelo (el DataFrame procesado)
+            st.write("Resultados ordenados por similitud de coseno:", response)
+    else:
+        st.warning("El archivo CSV no contiene la columna 'job_title'.")