Spaces:

mrmax14
/

Thera

Runtime error

App Files Files Community

Thera / app.py

mrmax14

init commit

a08b37b 6 months ago

raw

history blame

1.72 kB

	from transformers import LlamaForCausalLM, LlamaTokenizer
	import torch
	import os

	# Отримуємо токен із змінної середовища
	hf_token = os.getenv("HF_API_TOKEN")

	if not hf_token:
	raise ValueError("HF_API_TOKEN environment variable is not set")

	# Шлях до файлу моделі
	model_path = "path_to_downloaded_model/consolidated.00.pth" # Вкажіть правильний шлях

	# Завантажуємо токенізатор
	tokenizer = LlamaTokenizer.from_pretrained("meta-llama/Llama-2-7b-chat", token=hf_token)

	# Завантажуємо модель з файлу
	model = LlamaForCausalLM.from_pretrained(
	model_path,
	config="path_to_model/config.json", # Якщо є конфігураційний файл
	torch_dtype=torch.float32, # Використання full precision для CPU
	device_map="auto" # Для автоматичного розподілу на доступні пристрої
	)

	# Тестове введення
	input_text = "Hello, how can I assist you today?"
	inputs = tokenizer(input_text, return_tensors="pt")

	# Генерація тексту
	output = model.generate(
	inputs["input_ids"],
	max_length=50, # Максимальна довжина відповіді
	num_return_sequences=1, # Кількість відповідей
	do_sample=True, # Випадкове семплування для різноманіття
	temperature=0.7 # Регулювання "креативності"
	)

	# Декодуємо та виводимо результат
	decoded_output = tokenizer.decode(output[0], skip_special_tokens=True)
	print(f"\nВідповідь моделі: {decoded_output}")