jorge-henao commited on
Commit
1bcad2c
·
1 Parent(s): 054b0bf

Update about.py

Browse files
Files changed (1) hide show
  1. about.py +5 -5
about.py CHANGED
@@ -25,22 +25,22 @@ def show_about_ask2democracy():
25
  <li>Pre-procesado e indexación de la propuesta de reforma pensional de Colombia de Marzo 2023.</li>
26
  <li>Refactor UX y ajustes de usabilidad de la interfaz de usuario.</li>
27
  <li>Ajustes de integración con OpenAI</li>
28
- <li>Pruebas con Sentence transformers usando texto en español</li>
29
  </ul>
30
  <h4>Modelos de lenguaje:</h4>
31
  Fueron entrenados dos modelos Baizemocracy basados en LLaMA-7B con foco en aumentar generativamente las respuestas retornadas por los sentence transformers con el fin de hacerlo más conversacional usando modelos open source en español.
32
  Los siguientes modelos fueron entrenados entrenados con un dataset construido durante la hackathon además de varios datasets orientados a Question answering y Chat.
33
  <ul>
34
- <li>[hackathon-somos-nlp-2023/baizemocracy-lora-7B-cfqa](https://huggingface.co/hackathon-somos-nlp-2023/baizemocracy-lora-7B-cfqa): Esta variación del modelo es más enfocada en generar respuestas factuales dado un contexto basado en fuentes.</li>
35
- <li>[hackathon-somos-nlp-2023/baizemocracy-lora-7B-cfqa-conv](https://huggingface.co/hackathon-somos-nlp-2023/baizemocracy-lora-7B-cfqa-conv): Esta variación del modelo tiene un estílo más conversacional para generar respuestas factuales dado un contexto basado en fuentes.</li>
36
  </ul>
37
  <h4>Datasets:</h4>
38
  <ul>
39
- <li>[hackathon-somos-nlp-2023/ask2democracy-cfqa-salud-pension](https://huggingface.co/datasets/hackathon-somos-nlp-2023/ask2democracy-cfqa-salud-pension): Un datset de tipo instrucciones con respuestas a preguntas generadas a partir de en un contexto basado en fuentes.</li>
40
  </ul>
41
  Nota: Los modelos entrenados durante la hackathon requieren optimizaicón adicional para ser integrados en el pipeline de consulta.
42
  Durante la hackathon se realizaron pruebas con tiempos de inferencia de alredecor de <70 segundos sobre CPU, lo que dificulta la usabilidad en el demo usando hardware gratis de Hugging Face.
43
- Futuras actualizaciones se esperan incorporar en el demo original del proyecto [espacio demo original del proyecto](https://huggingface.co/spaces/jorge-henao/ask2democracycol)
44
 
45
  <h2>¿Cómo utilizar este espacio?</h2>
46
  Selecciona el de documento que quieres explorar en el panel de la izquierda, escribe preguntas en la caja de texto y presiona el botón.
 
25
  <li>Pre-procesado e indexación de la propuesta de reforma pensional de Colombia de Marzo 2023.</li>
26
  <li>Refactor UX y ajustes de usabilidad de la interfaz de usuario.</li>
27
  <li>Ajustes de integración con OpenAI</li>
28
+ <li>Pruebas/Ajustes en el pipeline de consulta Sentence transformers usando texto en español y xlm-roberta-base-squad2-distilled</li>
29
  </ul>
30
  <h4>Modelos de lenguaje:</h4>
31
  Fueron entrenados dos modelos Baizemocracy basados en LLaMA-7B con foco en aumentar generativamente las respuestas retornadas por los sentence transformers con el fin de hacerlo más conversacional usando modelos open source en español.
32
  Los siguientes modelos fueron entrenados entrenados con un dataset construido durante la hackathon además de varios datasets orientados a Question answering y Chat.
33
  <ul>
34
+ <li><a href="https://huggingface.co/hackathon-somos-nlp-2023/baizemocracy-lora-7B-cfqa">baizemocracy-lora-7B-cfqa</a>: Esta variación del modelo es más enfocada en generar respuestas factuales dado un contexto basado en fuentes.</li>
35
+ <li><a href="https://huggingface.co/hackathon-somos-nlp-2023/baizemocracy-lora-7B-cfqa-conv">baizemocracy-lora-7B-cfqa</a>: Esta variación del modelo tiene un estílo más conversacional para generar respuestas factuales dado un contexto basado en fuentes.</li>
36
  </ul>
37
  <h4>Datasets:</h4>
38
  <ul>
39
+ <li><a href="https://huggingface.co/datasets/hackathon-somos-nlp-2023/ask2democracy-cfqa-salud-pension">ask2democracy-cfqa-salud-pension</a>: Un datset de tipo instrucciones con respuestas a preguntas generadas a partir de en un contexto basado en fuentes.</li>
40
  </ul>
41
  Nota: Los modelos entrenados durante la hackathon requieren optimizaicón adicional para ser integrados en el pipeline de consulta.
42
  Durante la hackathon se realizaron pruebas con tiempos de inferencia de alredecor de <70 segundos sobre CPU, lo que dificulta la usabilidad en el demo usando hardware gratis de Hugging Face.
43
+ Futuras actualizaciones se esperan incorporar en el demo original del proyecto <a href="https://huggingface.co/spaces/jorge-henao/ask2democracycol">espacio demo original del pryecto</a>
44
 
45
  <h2>¿Cómo utilizar este espacio?</h2>
46
  Selecciona el de documento que quieres explorar en el panel de la izquierda, escribe preguntas en la caja de texto y presiona el botón.