Spaces:

chobob311
/

chatbot-demo

Runtime error

App Files Files Community

chobob311 commited on Oct 18, 2024

Commit

fefdb18

verified ·

1 Parent(s): 43dcf0c

Update app.py

Browse files

Files changed (1) hide show

app.py +18 -11

app.py CHANGED Viewed

@@ -2,20 +2,19 @@ import gradio as gr
 from transformers import LlamaTokenizer, LlamaForCausalLM
 import torch
-model_repo_id = "Bllossom/llama-3-Korean-Bllossom-70B"
-# 토크나이저 로드
 tokenizer = LlamaTokenizer.from_pretrained(
-    model_repo_id,
-    use_auth_token='your_hf_access_token'  # 필요한 경우 액세스 토큰 추가
 )
-# 모델 로드
 model = LlamaForCausalLM.from_pretrained(
-    model_repo_id,
-    torch_dtype=torch.float16,  # 또는 torch.bfloat16
-    device_map="auto",          # 가능한 경우 GPU에 자동 할당
-    use_auth_token='your_hf_access_token'  # 필요한 경우 액세스 토큰 추가
 )
 def respond(
@@ -32,8 +31,10 @@ def respond(
         prompt += f"User: {user_msg}\nAssistant: {bot_msg}\n"
     prompt += f"User: {message}\nAssistant:"
     inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
     outputs = model.generate(
         **inputs,
         max_new_tokens=max_tokens,
@@ -44,17 +45,23 @@ def respond(
         pad_token_id=tokenizer.eos_token_id,
     )
     response = tokenizer.decode(outputs[0], skip_special_tokens=True)
     response = response[len(prompt):].strip()
     history.append((message, response))
     return history
 demo = gr.ChatInterface(
     fn=respond,
     additional_inputs=[
-        gr.Textbox(value="You are a friendly Chatbot.", label="System message"),
         gr.Slider(minimum=1, maximum=2048, value=512, step=1, label="Max new tokens"),
         gr.Slider(minimum=0.1, maximum=4.0, value=0.7, step=0.1, label="Temperature"),
         gr.Slider(

 from transformers import LlamaTokenizer, LlamaForCausalLM
 import torch
+model_id = 'Bllossom/llama-3-Korean-Bllossom-70B'
+hf_access_token = 'ㅗㅗ'  # 실제 허깅페이스 액세스 토큰으로 교체하세요
+# 토크나이저와 모델 로드
 tokenizer = LlamaTokenizer.from_pretrained(
+    model_id,
+    use_auth_token=hf_access_token
 )
 model = LlamaForCausalLM.from_pretrained(
+    model_id,
+    torch_dtype=torch.bfloat16,
+    device_map="auto",
+    use_auth_token=hf_access_token
 )
 def respond(
         prompt += f"User: {user_msg}\nAssistant: {bot_msg}\n"
     prompt += f"User: {message}\nAssistant:"
+    # 입력 토큰화
     inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
+    # 모델 응답 생성
     outputs = model.generate(
         **inputs,
         max_new_tokens=max_tokens,
         pad_token_id=tokenizer.eos_token_id,
     )
+    # 응답 디코딩
     response = tokenizer.decode(outputs[0], skip_special_tokens=True)
     response = response[len(prompt):].strip()
+    # 히스토리에 추가
     history.append((message, response))
     return history
+# Gradio 인터페이스 생성
 demo = gr.ChatInterface(
     fn=respond,
     additional_inputs=[
+        gr.Textbox(
+            value="You are a friendly Chatbot.",
+            label="System message"
+        ),
         gr.Slider(minimum=1, maximum=2048, value=512, step=1, label="Max new tokens"),
         gr.Slider(minimum=0.1, maximum=4.0, value=0.7, step=0.1, label="Temperature"),
         gr.Slider(