HashTagDev
/

SAVIO-4bits-Turbo

Model card Files Files and versions

SAVIO-4bits-Turbo / README.md

HashTagDev's picture

Des(HashTag): Model Card has been created

2c16027 verified 9 months ago

|

history blame contribute delete

2.88 kB

	---
	language:
	- es
	base_model:
	- corneille97/llama-2-7b-4bits-turbo
	---
	# S.A.V.I.O: Sistema de Acesoria Virtual e Inteligencia en Operaciones
	SAVIO es un modelo de lenguaje ajustado específicamente para tareas de análisis y respuesta en contexto, con integración de capacidades de RAG (Retrieval-Augmented Generation). Este modelo está diseñado para procesar preguntas complejas en base a documentos proporcionados por el usuario y responde con precisión adaptándose al contenido.

	# Basado en
	+ LLaMA 2 from Meta IA
	+ Adaptado a quantización de 4bits en: "corneille97/llama-2-7b-4bits-turbo"
	El modelo base elegido proporciona una combinación óptima de rendimiento y eficiencia en memoria, haciendo de SAVIO una solución ligera y potente.

	# Características Principales
	Fine-Tuning Específico: SAVIO ha sido afinado con un conjunto de datos personalizado relacionado con ventas y análisis empresarial.
	Integración de RAG: El modelo permite la inclusión de archivos en formatos .pdf, .xlsx, y .csv para responder preguntas basadas en datos específicos.
	Eficiencia en Memoria: Utiliza técnicas avanzadas como cuantización a 4 bits y almacenamiento optimizado con SafeTensors y GUFF.
	Compatibilidad Extensa: Diseñado para despliegues en entornos limitados, desde servidores hasta bots de Telegram.

	# Herramientas Usadas
	+ Transformers: Para la carga y manipulación del modelo base.
	+ UnsLoth: Para cuantización eficiente y soporte de técnicas avanzadas como LoRA.
	+ PEFT: Para la implementación de Fine-Tuning eficiente con LoRA.
	+ RAG Framework: Integración para generación aumentada por recuperación.
	+ Datasets y Pandas: Manejo de datos personalizados en formatos .csv.
	+ Accelerate y BitsAndBytes: Optimización en el entrenamiento y uso del modelo.
	+ Torch y Safetensors: Guardado eficiente del modelo ajustado.

	# Uso
	SAVIO puede ser utilizado tanto localmente como en la nube para tareas como:
	+ Responder preguntas sobre datos de ventas en tiempo real.
	+ Integración en aplicaciones empresariales para análisis y reportes.
	+ Despliegue como bot de atención en plataformas como Telegram.

	# Ejemplo(python):
	from transformers import AutoTokenizer
	from unsloth import FastLanguageModel

	# Cargar el modelo
	model = FastLanguageModel.from_pretrained("usuario/SAVIO")
	tokenizer = AutoTokenizer.from_pretrained("usuario/SAVIO")

	# Pregunta
	question = "¿Cuáles fueron las ventas totales del último trimestre?"

	# Generar respuesta
	inputs = tokenizer(question, return_tensors="pt").to("cuda")
	output = model.generate(**inputs, max_new_tokens=100)
	response = tokenizer.decode(output[0], skip_special_tokens=True)
	print(response)

	# Licencia
	Sin licencia, uso aplicado de acuerdo con los terminos de uso de Llama (Meta IA)

	# Contribuciones
	Si deseas contribuir o reportar un problema, visita el repositorio asociado o contacta al equipo de desarrollo.