Spaces:
Running
Running
import os | |
import gradio as gr | |
from gradio.components import Slider | |
import torch | |
from transformers import pipeline | |
import pandas as pd | |
# Model, information and examples ---------------------------------------------- | |
MODEL_NAMES = ["FLOR-1.3B-GL","Cerebras-1.3B-GL"] | |
markdown_description_en = """ | |
# Galician LLMs | |
This space contains the Galician language models developed by [Proxecto Nós](https://nos.gal/en/proxecto-nos). | |
💐 **[FLOR-1.3B-GL](https://huggingface.co/proxectonos/FLOR-1.3B-GL)** is a 1.3B parameters model which is a Continual pretraining from [FLOR-1.3B](https://huggingface.co/projecte-aina/FLOR-1.3B), which is based in [Bloom 1.7B](https://huggingface.co/bigscience/bloom-1b7). | |
👀 **Learn more about FLOR-1.3B-GL:** [HF official model card](https://huggingface.co/proxectonos/FLOR-1.3B-GL). | |
🧠 **[Cerebras-1.3B-GL](https://huggingface.co/proxectonos/Cerebras-1.3B-GL)** is a 1.3B parameters model based in [Cerebras-GPT 1.3B](https://huggingface.co/cerebras/Cerebras-GPT-1.3B). | |
👀 **Learn more about Cerebras-1.3B-GL:** [HF official model card](https://huggingface.co/proxectonos/Cerebras-1.3B-GL) | |
""" | |
markdown_description_gl = """ | |
# LLMs de galego | |
Este espazo grandes modelos da linguaxe feitos para o galego desenvolvidos polo [Proxecto Nós](https://nos.gal/en/proxecto-nos). | |
💐 **[FLOR-1.3B-GL](https://huggingface.co/proxectonos/FLOR-1.3B-GL)** é un modelo de parámetros 1.3B que é un preadestramento continuo de [FLOR-1.3B]( https://huggingface.co/projecte-aina/FLOR-1.3B), baseado a súa vez en [Bloom 1.7B](https://huggingface.co/bigscience/bloom-1b7). | |
👀 **Máis información sobre FLOR-1.3B-GL:** [tarxeta modelo oficial HF](https://huggingface.co/proxectonos/FLOR-1.3B-GL). | |
🧠 **[Cerebras-1.3B-GL](https://huggingface.co/proxectonos/Cerebras-1.3B-GL)** é un modelo de parámetros 1.3B baseado en [Cerebras-GPT 1.3B](https:/ /huggingface.co/cerebras/Cerebras-GPT-1.3B). | |
👀 **Máis información sobre Cerebras-1.3B-GL:** [tarxeta modelo oficial HF](https://huggingface.co/proxectonos/Cerebras-1.3B-GL) | |
""" | |
markdown_description ={"en": markdown_description_en,"gl": markdown_description_gl} | |
short_prompts_examples = [ | |
["A receita tradicional das filloas é"], | |
["O neno vivía preto de"] | |
] | |
few_shot_prompts_examples = [ | |
["Responde á seguinte pregunta. \nPregunta: \"Cal é a capital de Noruega? \"\nResposta: \"A capital de Noruega é Oslo.\"\n---- \nResponde á seguinte pregunta.\nPregunta: \"Cal é a moeda de Portugal\" \nResposta: \"A moeda de Portugal é o euro.\" \n---- \nResponde á seguinte pregunta. \nPregunta: \"Cal é a capital de Suecia?\"\nResposta:"], | |
["Extrae as entidades nomeadas do seguinte texto: \nTexto: \"Chámome Wolfgang e vivo en Berlin\" \nEntidades: Wolfgang:PER, Berlin:LOC \n ---- \nExtrae as entidades nomeadas do seguinte texto: \nTexto: \"María e Miguel non teñen ningún problema\" \nEntidades: María:PER, Miguel:PER \n---- \nExtrae as entidades nomeadas do seguinte texto: \nTexto: \"O mellor de Barcelona é o bar do meu amigo Pablo\" \nEntidades: Pablo:PER, Barcelona:LOC \n---- \nExtrae as entidades nomeadas do seguinte texto: \nTexto: \"Carlos comparte cuarto con Marc\" \nEntidades:"], | |
["Cualifica como Positivo ou Negativo o sentimento da seguinte frase:\n Texto: \"Estou moi feliz\"\n Polaridade: Positivo\n ---- \n Cualifica como Positivo ou Negativo o sentimento da seguinte frase:\n Texto: \"Non me gusta beber cervexa\"\n Polaridade: Negativo\n ----\n Cualifica como Positivo ou Negativo o sentimento da seguinte frase:\n Texto: \"O meu pai detesta o seu traballo\"\n Polaridade: Negativo\n ----\n Cualifica como Positivo ou Negativo o sentimento da seguinte frase:\n Texto: \"Uxía desfruta xogando ao fútbol\"\n Polaridade: Positivo\n ----\n Cualifica como Positivo ou Negativo o sentimento da seguinte frase:\n Texto: \"O neno non está contento coas notas\"\n Polaridade:"] | |
] | |
fronted_theme = 'Soft' | |
# Model charge --------------------------------------------------------- | |
model_id_flor = "proxectonos/FLOR-1.3B-GL" | |
generator_model_flor = pipeline("text-generation", model=model_id_flor) | |
model_id_cerebras = "proxectonos/Cerebras-1.3B-GL" | |
generator_model_cerebras = pipeline("text-generation", model=model_id_cerebras, token=os.environ['TOKEN_HF']) | |
# Load language texts --------------------------------------------------------- | |
df_interface = pd.read_csv("interface_texts.csv") | |
language = "gl" | |
# Generation functions --------------------------------------------------------- | |
def get_model(model_selection): | |
if model_selection == "FLOR-1.3B-GL": | |
return generator_model_flor | |
else: | |
return generator_model_cerebras | |
def remove_empty_lines(text): | |
lines = text.strip().split("\n") | |
non_empty_lines = [line for line in lines if line.strip()] | |
return "\n".join(non_empty_lines) | |
def predict(prompt, model_select, max_length, repetition_penalty, temperature): | |
print("Dentro da xeración...") | |
generator_model = get_model(model_select) | |
prompt_length = len(generator_model.tokenizer.encode(prompt)) | |
generated_text = generator_model( | |
prompt, | |
max_length=prompt_length + max_length, | |
pad_token_id=generator_model.tokenizer.eos_token_id, | |
repetition_penalty=repetition_penalty, | |
temperature=temperature, | |
do_sample=True) | |
generated_sequence = generated_text[0]['generated_text'] | |
if generated_sequence is None: | |
gr.Warning('Inference endpoint is not available right now. Please try again later.') | |
return | |
generated_sequence = remove_empty_lines(generated_sequence) | |
print("Xeración completada") | |
return generated_sequence | |
# Gradio app --------------------------------------------------------- | |
def get_text_lang(variable): | |
return df_interface.loc[df_interface['variable'] == variable, language].values[0] | |
def clear(): | |
return ( | |
None, | |
None, | |
gr.update(value=20), | |
gr.update(value=1.3), | |
gr.update(value=0.5) | |
) | |
def pass_to_input(generated_gl): | |
return ( | |
gr.update(value=generated_gl), | |
None | |
) | |
def parameters_default(text): | |
return ( | |
gr.update(value=30), # max_length | |
gr.update(value=1.3), # repetition_penalty | |
gr.update(value=0.5) # temperature | |
) | |
def parameters_fewshot_prompt(text): | |
return ( | |
gr.update(value=15), # max_length | |
gr.update(value=1), # repetition_penalty | |
gr.update(value=0.5) # temperature | |
) | |
def gradio_app(): | |
with gr.Blocks(theme=fronted_theme) as demo: | |
with gr.Row(): | |
with gr.Column(scale=0.1): | |
gr.HTML('<img src="https://huggingface.co/spaces/proxectonos/README/resolve/main/title-card.png" width="100%" style="border-radius: 0.75rem;">') | |
with gr.Column(): | |
gr.Markdown(markdown_description[language]) | |
with gr.Row(equal_height=True): | |
model_select = gr.Dropdown( | |
label=get_text_lang("model_select"), | |
choices=MODEL_NAMES, | |
value=MODEL_NAMES[0], | |
interactive=True | |
) | |
with gr.Row(equal_height=True): | |
with gr.Column(): | |
text_gl = gr.Textbox(label=get_text_lang("text_gl"), | |
lines=6, placeholder="e.g. O neno vai a escola con ") | |
with gr.Row(variant="panel"): | |
with gr.Accordion(get_text_lang("accordion_parameters"), open=False): | |
max_length = Slider( | |
minimum=1, | |
maximum=200, | |
step=1, | |
value=30, | |
label=get_text_lang("max_length") | |
) | |
repetition_penalty = Slider( | |
minimum=0.1, | |
maximum=4, | |
step=0.1, | |
value=1.3, | |
label=get_text_lang("repetition_penalty") | |
) | |
temperature = Slider( | |
minimum=0, | |
maximum=1, | |
value=0.5, | |
label=get_text_lang("temperature") | |
) | |
generator_btn = gr.Button(value=get_text_lang("generator_btn"),variant='primary') | |
with gr.Column(): | |
generated_gl = gr.Textbox(label=get_text_lang("generated_gl_label"), | |
lines=6, | |
placeholder=get_text_lang("generated_gl_placeholder"), | |
interactive=False, | |
show_copy_button=True) | |
pass_btn = gr.Button(value=get_text_lang("pass_btn")) | |
clean_btn = gr.Button(value=get_text_lang("clean_btn")) | |
generator_btn.click(predict, inputs=[text_gl, model_select, max_length, repetition_penalty, temperature], outputs=generated_gl, api_name="generate-flor-gl") | |
clean_btn.click(fn=clear, inputs=[], outputs=[text_gl, generated_gl, max_length, repetition_penalty, temperature], queue=False, api_name=False) | |
pass_btn.click(fn=pass_to_input, inputs=[generated_gl], outputs=[text_gl,generated_gl], queue=False, api_name=False) | |
with gr.Row(): | |
with gr.Column(scale=0.5): | |
gr.Examples( | |
label = get_text_lang("examples_short_prompts"), | |
examples = short_prompts_examples, | |
inputs = [text_gl], | |
outputs = [max_length, repetition_penalty, temperature], | |
fn = parameters_default, | |
run_on_click = True | |
) | |
gr.Examples( | |
label = get_text_lang("examples_few_shot"), | |
examples = few_shot_prompts_examples, | |
inputs = [text_gl], | |
outputs = [max_length, repetition_penalty, temperature], | |
fn = parameters_fewshot_prompt, | |
run_on_click = True | |
) | |
demo.launch() | |
if __name__ == "__main__": | |
gradio_app() |