Spaces:

alaa-ahmed14
/

trial2

Sleeping

trial2 / app.py

Update app.py

bc5f9c0 verified 6 months ago

828 Bytes

	from fastapi import FastAPI
	from transformers import AutoTokenizer, AutoModelForCausalLM
	import torch

	import os


	# Set cache directory for Hugging Face Transformers
	os.environ["TRANSFORMERS_CACHE"] = "/home/user/.cache"

	# Load the tokenizer and model
	tokenizer = AutoTokenizer.from_pretrained("matsant01/STEMerald-2b")
	model = AutoModelForCausalLM.from_pretrained("matsant01/STEMerald-2b")

	# Initialize FastAPI app
	app = FastAPI()



	@app.get("/")
	def read_root():
	return {"message": "Welcome to the STEMerald-2b API"}

	#@app.post("/generate/")
	#def generate_text(prompt: str):
	# inputs = tokenizer(prompt, return_tensors="pt")
	# outputs = model.generate(inputs["input_ids"], max_length=50)
	# generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
	# return {"generated_text": generated_text}