Spaces:

bstraehle
/

vertex-ai

Running

App Files Files Community

vertex-ai / app.py

bstraehle

Update app.py

22ebce8 over 1 year ago

raw

history blame

3.37 kB

	import gradio as gr
	import json, os, vertexai, wandb

	from dotenv import load_dotenv, find_dotenv
	_ = load_dotenv(find_dotenv())

	credentials = os.environ["CREDENTIALS"]
	project = os.environ["PROJECT"]
	wandb_api_key = os.environ["WANDB_API_KEY"]

	config = {
	"max_output_tokens": 800,
	#"model": "text-bison@001",
	"model": "gemini-pro",
	"temperature": 0.1,
	"top_k": 40,
	"top_p": 1.0,
	}

	credentials = json.loads(credentials)

	from google.oauth2 import service_account
	credentials = service_account.Credentials.from_service_account_info(credentials)

	if credentials.expired:
	credentials.refresh(Request())

	vertexai.init(project = project,
	location = "us-central1",
	credentials = credentials
	)

	#from vertexai.language_models import TextGenerationModel
	#generation_model = TextGenerationModel.from_pretrained(config["model"])
	from vertexai.preview.generative_models import GenerativeModel
	generation_model = GenerativeModel(config["model"])

	def wandb_log(prompt, completion):
	wandb.login(key = wandb_api_key)
	wandb.init(project = "vertex-ai-llm", config = config)
	wandb.log({"prompt": str(prompt), "completion": str(completion)})
	wandb.finish()

	def invoke(prompt):
	if (prompt == ""):
	raise gr.Error("Prompt is required.")
	completion = ""
	try:
	#completion = generation_model.predict(prompt = prompt,
	# max_output_tokens = config["max_output_tokens"],
	# temperature = config["temperature"],
	# top_k = config["top_k"],
	# top_p = config["top_p"],
	# )
	#if (completion.text != None):
	# completion = completion.text
	completion = generation_model.generate_content(prompt, generation_config = {
	"max_output_tokens": config["max_output_tokens"],
	"temperature": config["temperature"],
	"top_k": config["top_k"],
	"top_p": config["top_p"],
	})
	if (completion.text != None):
	completion = completion.text
	except Exception as e:
	raise gr.Error(e)
	finally:
	wandb_log(prompt, completion)
	return completion
	#return "🛑 Execution is commented out. To view the source code see https://huggingface.co/spaces/bstraehle/google-vertex-ai-llm/tree/main."

	description = """<a href='https://www.gradio.app/'>Gradio</a> UI using <a href='https://cloud.google.com/vertex-ai?hl=en/'>Google Vertex AI</a> API
	with gemini-pro foundation model. RAG evaluation via <a href='https://wandb.ai/bstraehle'>Weights & Biases</a>."""

	gr.close_all()
	demo = gr.Interface(fn=invoke,
	inputs = [gr.Textbox(label = "Prompt", lines = 1)],
	outputs = [gr.Textbox(label = "Completion", lines = 1)],
	title = "Generative AI - LLM",
	description = description)
	demo.launch()