LLM2

Runtime error

App Files Files Community

LLM2 / app.py

Raven7

Update app.py

f3ae789 verified 12 months ago

raw

history blame

4.19 kB

	import gradio as gr
	from huggingfacehub import InferenceClient, HfApi
	import os
	import requests
	import pandas as pd
	import json

	# Hugging Face 토큰 확인
	hftoken = os.getenv("H")

	if not hftoken:
	raise ValueError("H 환경 변수가 설정되지 않았습니다.")

	# 모델 정보 확인
	api = HfApi(token=hftoken)

	try:
	client = InferenceClient("meta-llama/Meta-Llama-3-70B-Instruct", token="H")
	except Exception as e:
	print(f"rror initializing InferenceClient: {e}")
	# 대체 모델을 사용하거나 오류 처리를 수행하세요.
	# 예: client = InferenceClient("gpt2", token=hftoken)

	# 현재 스크립트의 디렉토리를 기준으로 상대 경로 설정
	currentdir = os.path.dirname(os.path.abspath(file))
	csvpath = os.path.join(currentdir, 'prompts.csv')
	datapath = os.path.join(currentdir, 'newdataset.parquet')

	# CSV 파일 로드
	promptsdf = pd.readcsv(csvpath)
	datadf = pd.readparquet(datapath)

	def getprompt(act):
	matchingprompt = promptsdf[promptsdf['act'] == act]['prompt'].values
	return matchingprompt[0] if len(matchingprompt) 0 else None

	def respond(
	message,
	history: list[tuple[str, str]],
	systemmessage,
	maxtokens,
	temperature,
	topp,
	):
	# 사용자 입력에 따른 프롬프트 선택
	prompt = getprompt(message)
	if prompt:
	response = prompt # CSV에서 찾은 프롬프트를 직접 반환
	else:
	systemprefix = """
	당신은 챗봇입니다. 모든 질문에 대해 친절하고 정확한 답변을 제공하세요.
	질문에 대한 답변을 찾을 수 없는 경우, 적절한 대안을 제공해 주세요.
	"""

	fullprompt = f"{systemprefix} {systemmessage}\n\n"

	for user, assistant in history:
	fullprompt += f"Human: {user}\nAI: {assistant}\n"

	fullprompt += f"Human: {message}\nAI:"
	APIL = "https://api-inference.huggingface.co/models/meta-llama/Meta-Llama-3-70B-Instruct"
	headers = {"Authorization": f"Bearer {hftoken}"}


	def query(payload):
	response = requests.post(APIL, headers=headers, json=payload)
	return response.text # 원시 응답 텍스트 반환

	try:
	payload = {
	"inputs": fullprompt,
	"parameters": {
	"maxnewtokens": maxtokens,
	"temperature": temperature,
	"topp": topp,
	"returnfulltext": False
	},
	}
	rawresponse = query(payload)
	print("aw API response:", rawresponse) # 디버깅을 위해 원시 응답 출력

	try:
	output = json.loads(rawresponse)
	if isinstance(output, list) and len(output) 0 and "generatedtext" in output[0]:
	response = output[0]["generatedtext"]
	else:
	response = f"예상치 못한 응답 형식입니다: {output}"
	except json.JSecoderror:
	response = f"JS 디코딩 오류. 원시 응답: {rawresponse}"

	except Exception as e:
	print(f"오류: 응답 생성 중 오류가 발생했습니다: {str(e)}")
	response = f"죄송합니다. 응답 생성 중 오류가 발생했습니다: {str(e)}"

	demo = gr.ChatInterface(
	respond,
	title="My Chatbot",
	description="This is my chatbot!",
	additional_inputs=[
	gr.Textbox(value="""
	당신은 챗봇입니다. 모든 질문에 대해 친절하고 정확한 답변을 제공하세요.
	질문에 대한 답변을 찾을 수 없는 경우, 적절한 대안을 제공해 주세요.
	""", label="시스템 프롬프트"),
	gr.Slider(minimum=1, maximum=4000, value=2000, step=1, label="최대 토큰 수"),
	gr.Slider(minimum=0.1, maximum=4.0, value=1.0, step=0.1, label="온도"),
	gr.Slider(
	minimum=0.1,
	maximum=1.0,
	value=0.95,
	step=0.05,
	label="top-p (핵심 샘플링)",
	),
	],
	examples=[
	["안녕"],
	["계속 이어서 작성해봐"],
	],
	cache_examples=False,
	)

	if __name__ == "__main__":
	demo.launch()