Spaces:

proxectonos
/

Nos_LLM_galician

Running

App Files Files Community

Nos_LLM_galician / app.py

pablo-rf

Wait to change lang

4b8ba13 7 months ago

raw

history blame

10.8 kB

	import os
	import gradio as gr
	from gradio.components import Slider
	import torch
	from transformers import pipeline
	import pandas as pd

	# Model, information and examples ----------------------------------------------
	MODEL_NAMES = ["FLOR-1.3B-GL","Cerebras-1.3B-GL"]
	markdown_description_en = """
	# Galician LLMs


	This space contains the Galician language models developed by [Proxecto Nós](https://nos.gal/en/proxecto-nos).


	💐 [FLOR-1.3B-GL](https://huggingface.co/proxectonos/FLOR-1.3B-GL) is a 1.3B parameters model which is a Continual pretraining from [FLOR-1.3B](https://huggingface.co/projecte-aina/FLOR-1.3B), which is based in [Bloom 1.7B](https://huggingface.co/bigscience/bloom-1b7).

	👀 Learn more about FLOR-1.3B-GL: [HF official model card](https://huggingface.co/proxectonos/FLOR-1.3B-GL).


	🧠 [Cerebras-1.3B-GL](https://huggingface.co/proxectonos/Cerebras-1.3B-GL) is a 1.3B parameters model based in [Cerebras-GPT 1.3B](https://huggingface.co/cerebras/Cerebras-GPT-1.3B).

	👀 Learn more about Cerebras-1.3B-GL: [HF official model card](https://huggingface.co/proxectonos/Cerebras-1.3B-GL)
	"""

	markdown_description_gl = """
	# LLMs de galego


	Este espazo contén diferentes Grandes Modelos da Linguaxe feitos para o galego desenvolvidos polo [Proxecto Nós](https://nos.gal/en/proxecto-nos).


	💐 [FLOR-1.3B-GL](https://huggingface.co/proxectonos/FLOR-1.3B-GL) é un modelo de parámetros 1.3B que é un preadestramento continuo de [FLOR-1.3B]( https://huggingface.co/projecte-aina/FLOR-1.3B), baseado a súa vez en [Bloom 1.7B](https://huggingface.co/bigscience/bloom-1b7).

	👀 Máis información sobre FLOR-1.3B-GL: [tarxeta modelo oficial HF](https://huggingface.co/proxectonos/FLOR-1.3B-GL).


	🧠 [Cerebras-1.3B-GL](https://huggingface.co/proxectonos/Cerebras-1.3B-GL) é un modelo de parámetros 1.3B baseado en [Cerebras-GPT 1.3B](https:/ /huggingface.co/cerebras/Cerebras-GPT-1.3B).

	👀 Máis información sobre Cerebras-1.3B-GL: [tarxeta modelo oficial HF](https://huggingface.co/proxectonos/Cerebras-1.3B-GL)
	"""

	markdown_description ={"en": markdown_description_en,"gl": markdown_description_gl}
	short_prompts_examples = [
	["A receita tradicional das filloas é"],
	["O neno vivía preto de"]
	]

	few_shot_prompts_examples = [
	["Responde á seguinte pregunta. \nPregunta: \"Cal é a capital de Noruega? \"\nResposta: \"A capital de Noruega é Oslo.\"\n---- \nResponde á seguinte pregunta.\nPregunta: \"Cal é a moeda de Portugal\" \nResposta: \"A moeda de Portugal é o euro.\" \n---- \nResponde á seguinte pregunta. \nPregunta: \"Cal é a capital de Suecia?\"\nResposta:"],
	["Extrae as entidades nomeadas do seguinte texto: \nTexto: \"Chámome Wolfgang e vivo en Berlin\" \nEntidades: Wolfgang:PER, Berlin:LOC \n ---- \nExtrae as entidades nomeadas do seguinte texto: \nTexto: \"María e Miguel non teñen ningún problema\" \nEntidades: María:PER, Miguel:PER \n---- \nExtrae as entidades nomeadas do seguinte texto: \nTexto: \"O mellor de Barcelona é o bar do meu amigo Pablo\" \nEntidades: Pablo:PER, Barcelona:LOC \n---- \nExtrae as entidades nomeadas do seguinte texto: \nTexto: \"Carlos comparte cuarto con Marc\" \nEntidades:"],
	["Cualifica como Positivo ou Negativo o sentimento da seguinte frase:\n Texto: \"Estou moi feliz\"\n Polaridade: Positivo\n ---- \n Cualifica como Positivo ou Negativo o sentimento da seguinte frase:\n Texto: \"Non me gusta beber cervexa\"\n Polaridade: Negativo\n ----\n Cualifica como Positivo ou Negativo o sentimento da seguinte frase:\n Texto: \"O meu pai detesta o seu traballo\"\n Polaridade: Negativo\n ----\n Cualifica como Positivo ou Negativo o sentimento da seguinte frase:\n Texto: \"Uxía desfruta xogando ao fútbol\"\n Polaridade: Positivo\n ----\n Cualifica como Positivo ou Negativo o sentimento da seguinte frase:\n Texto: \"O neno non está contento coas notas\"\n Polaridade:"]
	]
	fronted_theme = 'Soft'

	# Model charge ---------------------------------------------------------
	model_id_flor = "proxectonos/FLOR-1.3B-GL"
	generator_model_flor = pipeline("text-generation", model=model_id_flor)
	model_id_cerebras = "proxectonos/Cerebras-1.3B-GL"
	generator_model_cerebras = pipeline("text-generation", model=model_id_cerebras, token=os.environ['TOKEN_HF'])

	# Load language texts ---------------------------------------------------------
	df_interface = pd.read_csv("interface_texts.csv")
	language = "gl"

	# Generation functions ---------------------------------------------------------
	def get_model(model_selection):
	if model_selection == "FLOR-1.3B-GL":
	return generator_model_flor
	else:
	return generator_model_cerebras

	def remove_empty_lines(text):
	lines = text.strip().split("\n")
	non_empty_lines = [line for line in lines if line.strip()]
	return "\n".join(non_empty_lines)

	def predict(prompt, model_select, max_length, repetition_penalty, temperature):
	print("Dentro da xeración...")
	generator_model = get_model(model_select)
	prompt_length = len(generator_model.tokenizer.encode(prompt))
	generated_text = generator_model(
	prompt,
	max_length=prompt_length + max_length,
	pad_token_id=generator_model.tokenizer.eos_token_id,
	repetition_penalty=repetition_penalty,
	temperature=temperature,
	do_sample=True)

	generated_sequence = generated_text[0]['generated_text']
	if generated_sequence is None:
	gr.Warning('Inference endpoint is not available right now. Please try again later.')
	return

	generated_sequence = remove_empty_lines(generated_sequence)
	print("Xeración completada")
	return generated_sequence

	# Gradio app ---------------------------------------------------------
	def get_text_lang(variable):
	return df_interface.loc[df_interface['variable'] == variable, language].values[0]

	def change_language(demo):
	if language == "gl":
	language = "en"
	else:
	language = "gl"
	demo.launch()

	def clear():
	return (
	None,
	None,
	gr.update(value=20),
	gr.update(value=1.3),
	gr.update(value=0.5)
	)
	def pass_to_input(generated_gl):
	return (
	gr.update(value=generated_gl),
	None
	)

	def parameters_default(text):
	return (
	gr.update(value=30), # max_length
	gr.update(value=1.3), # repetition_penalty
	gr.update(value=0.5) # temperature
	)

	def parameters_fewshot_prompt(text):
	return (
	gr.update(value=15), # max_length
	gr.update(value=1), # repetition_penalty
	gr.update(value=0.5) # temperature
	)

	def gradio_app():
	with gr.Blocks(theme=fronted_theme) as demo:
	with gr.Row():
	with gr.Column(scale=0.1):
	change_lang = gr.Button(value=get_text_lang("change_lang"))
	gr.HTML('<img src="https://huggingface.co/spaces/proxectonos/README/resolve/main/title-card.png" width="100%" style="border-radius: 0.75rem;">')
	with gr.Column():
	gr.Markdown(markdown_description[language])
	with gr.Row(equal_height=True):
	model_select = gr.Dropdown(
	label=get_text_lang("model_select"),
	choices=MODEL_NAMES,
	value=MODEL_NAMES[0],
	interactive=True
	)
	with gr.Row(equal_height=True):
	with gr.Column():
	text_gl = gr.Textbox(label=get_text_lang("text_gl"),
	lines=6, placeholder="e.g. O neno vai a escola con ")
	with gr.Row(variant="panel"):
	with gr.Accordion(get_text_lang("accordion_parameters"), open=False):
	max_length = Slider(
	minimum=1,
	maximum=200,
	step=1,
	value=30,
	label=get_text_lang("max_length")
	)
	repetition_penalty = Slider(
	minimum=0.1,
	maximum=4,
	step=0.1,
	value=1.3,
	label=get_text_lang("repetition_penalty")
	)
	temperature = Slider(
	minimum=0,
	maximum=1,
	value=0.5,
	label=get_text_lang("temperature")
	)
	generator_btn = gr.Button(value=get_text_lang("generator_btn"),variant='primary')
	with gr.Column():
	generated_gl = gr.Textbox(label=get_text_lang("generated_gl_label"),
	lines=6,
	placeholder=get_text_lang("generated_gl_placeholder"),
	interactive=False,
	show_copy_button=True)
	pass_btn = gr.Button(value=get_text_lang("pass_btn"))
	clean_btn = gr.Button(value=get_text_lang("clean_btn"))

	generator_btn.click(predict, inputs=[text_gl, model_select, max_length, repetition_penalty, temperature], outputs=generated_gl, api_name="generate-flor-gl")
	clean_btn.click(fn=clear, inputs=[], outputs=[text_gl, generated_gl, max_length, repetition_penalty, temperature], queue=False, api_name=False)
	pass_btn.click(fn=pass_to_input, inputs=[generated_gl], outputs=[text_gl,generated_gl], queue=False, api_name=False)
	change_lang.click(fn=change_language, inputs=[demo], outputs=[], queue=False, api_name=False)

	with gr.Row():
	with gr.Column(scale=0.5):
	gr.Examples(
	label = get_text_lang("examples_short_prompts"),
	examples = short_prompts_examples,
	inputs = [text_gl],
	outputs = [max_length, repetition_penalty, temperature],
	fn = parameters_default,
	run_on_click = True
	)
	gr.Examples(
	label = get_text_lang("examples_few_shot"),
	examples = few_shot_prompts_examples,
	inputs = [text_gl],
	outputs = [max_length, repetition_penalty, temperature],
	fn = parameters_fewshot_prompt,
	run_on_click = True
	)

	demo.launch()

	if __name__ == "__main__":
	gradio_app()