Spaces:

yash009
/

textgeneration

Runtime error

File size: 871 Bytes

9bf2007
 
dcd2d54
3e6fc0f
9bf2007
 
 
e5e2748
dcd2d54
e5e2748
9bf2007
3e6fc0f
 
 
 
 
e5e2748
9bf2007
 
 
 
 
 
 
 
 
 
 
 
e5e2748
9bf2007
 
ed0c347
9bf2007
b554914
9bf2007

import transformers
import torch

from fastapi import FastAPI

from transformers import AutoTokenizer

# Load the model

app = FastAPI()
model = "meta-llama/Llama-2-70b"

@app.get("/")
def read_root():
    return {"Hello": "World!"}

@app.get("/llama")
def llama():
    tokenizer = AutoTokenizer.from_pretrained(model)

    pipeline = transformers.pipeline("text-generation" ,model=model ,torch_dtype=torch.float16 ,device_map="auto" , )

    sequences = pipeline(
        'I liked "Breaking Bad" and "Band of Brothers". Do you have any recommendations of other shows I might like?\n',
        do_sample=True,
        top_k=10,
        num_return_sequences=1,
        eos_token_id=tokenizer.eos_token_id,
        max_length=200,
    )

    for seq in sequences:
        print("Result: {seq['generated_text']}")
    
    return {"output": sequences[0]["generated_text"]}