ginipick commited on
Commit
71edfae
β€’
1 Parent(s): 884361c

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +17 -18
app.py CHANGED
@@ -42,10 +42,10 @@ def respond(
42
  message,
43
  history: List[Tuple[str, str]],
44
  system_message="", # κΈ°λ³Έκ°’ μΆ”κ°€
45
- max_tokens=1024, # κΈ°λ³Έκ°’ μΆ”κ°€
46
- temperature=0.7, # κΈ°λ³Έκ°’ μΆ”κ°€
47
- top_p=0.9, # κΈ°λ³Έκ°’ μΆ”κ°€
48
- ):
49
  global fashion_code, uhdimage_code, MixGEN_code, current_parquet_content
50
  system_message = system_message or ""
51
  system_prefix = """λ°˜λ“œμ‹œ ν•œκΈ€λ‘œ 닡변할것. λ„ˆλŠ” 주어진 μ†ŒμŠ€μ½”λ“œλ₯Ό 기반으둜 "μ„œλΉ„μŠ€ μ‚¬μš© μ„€λͺ… 및 μ•ˆλ‚΄, Q&Aλ₯Ό ν•˜λŠ” 역할이닀". μ•„μ£Ό μΉœμ ˆν•˜κ³  μžμ„Έν•˜κ²Œ 4000토큰 이상 Markdown ν˜•μ‹μœΌλ‘œ μž‘μ„±ν•˜λΌ. λ„ˆλŠ” μ½”λ“œλ₯Ό 기반으둜 μ‚¬μš© μ„€λͺ… 및 질의 응닡을 μ§„ν–‰ν•˜λ©°, μ΄μš©μžμ—κ²Œ 도움을 μ£Όμ–΄μ•Ό ν•œλ‹€. μ΄μš©μžκ°€ κΆκΈˆν•΄ ν•  λ§Œν•œ λ‚΄μš©μ— μΉœμ ˆν•˜κ²Œ μ•Œλ €μ£Όλ„λ‘ ν•˜λΌ. μ½”λ“œ 전체 λ‚΄μš©μ— λŒ€ν•΄μ„œλŠ” λ³΄μ•ˆμ„ μœ μ§€ν•˜κ³ , ν‚€ κ°’ 및 μ—”λ“œν¬μΈνŠΈμ™€ ꡬ체적인 λͺ¨λΈμ€ κ³΅κ°œν•˜μ§€ 마라."""
@@ -93,8 +93,8 @@ def respond(
93
 
94
  def upload_csv(file):
95
  try:
96
- # CSV 파일 읽기 (filepath νƒ€μž…μ΄λ―€λ‘œ file은 경둜 λ¬Έμžμ—΄)
97
- df = pd.read_csv(file)
98
 
99
  # CSV 파일의 컬럼 확인
100
  required_columns = {'id', 'text', 'label', 'metadata'}
@@ -127,24 +127,18 @@ def upload_csv(file):
127
  return f"CSV 파일 μ—…λ‘œλ“œ 및 λ³€ν™˜ 쀑 였λ₯˜κ°€ λ°œμƒν–ˆμŠ΅λ‹ˆλ‹€: {str(e)}", ""
128
 
129
  # Gradio Blocks μΈν„°νŽ˜μ΄μŠ€ μ„€μ •
130
- with gr.Blocks(theme="Nymbo/Nymbo_Theme",) as demo:
131
  gr.Markdown("# LLM μ„œλΉ„μŠ€ μΈν„°νŽ˜μ΄μŠ€")
132
 
133
  with gr.Tab("챗봇"):
134
  gr.Markdown("### LLMκ³Ό λŒ€ν™”ν•˜κΈ°")
135
  chat = gr.ChatInterface(
136
- respond,
137
- additional_inputs=[
138
- gr.Textbox(label="System Message", value=""),
139
- gr.Slider(minimum=1, maximum=8000, value=4000, label="Max Tokens"),
140
- gr.Slider(minimum=0, maximum=1, value=0.7, label="Temperature"),
141
- gr.Slider(minimum=0, maximum=1, value=0.9, label="Top P"),
142
- ],
143
  examples=[
144
  ["νŒ¨μ…˜ μ½”λ“œ μ‹€ν–‰"],
145
  ["UHD 이미지 μ½”λ“œ μ‹€ν–‰"],
146
  ["MixGEN μ½”λ“œ μ‹€ν–‰"],
147
- ["test.parquet μ‹€ν–‰"], # μƒˆλ‘œμš΄ 예제 μΆ”κ°€
148
  ["μƒμ„Έν•œ μ‚¬μš© 방법을 마치 화면을 λ³΄λ©΄μ„œ μ„€λͺ…ν•˜λ“―이 4000 토큰 이상 μžμ„Ένžˆ μ„€λͺ…ν•˜λΌ"],
149
  ["FAQ 20건을 μƒμ„Έν•˜κ²Œ μž‘μ„±ν•˜λΌ. 4000토큰 이상 μ‚¬μš©ν•˜λΌ."],
150
  ["μ‚¬μš© 방법과 차별점, νŠΉμ§•, 강점을 μ€‘μ‹¬μœΌλ‘œ 4000 토큰 이상 유튜브 μ˜μƒ 슀크립트 ν˜•νƒœλ‘œ μž‘μ„±ν•˜λΌ"],
@@ -152,10 +146,15 @@ with gr.Blocks(theme="Nymbo/Nymbo_Theme",) as demo:
152
  ["νŠΉν—ˆ μΆœμ›μ— ν™œμš©ν•  기술 및 λΉ„μ¦ˆλ‹ˆμŠ€λͺ¨λΈ 츑면을 ν¬ν•¨ν•˜μ—¬ νŠΉν—ˆ μΆœμ›μ„œ ꡬ성에 맞게 ν˜μ‹ μ μΈ 창의 발λͺ… λ‚΄μš©μ„ μ€‘μ‹¬μœΌλ‘œ 4000 토큰 이상 μž‘μ„±ν•˜λΌ."],
153
  ["계속 μ΄μ–΄μ„œ λ‹΅λ³€ν•˜λΌ"],
154
  ],
155
- theme="Nymbo/Nymbo_Theme",
156
- cache_examples=False, # 캐싱 λΉ„ν™œμ„±ν™” μ„€μ •
157
  )
158
 
 
 
 
 
 
 
159
  with gr.Tab("데이터 λ³€ν™˜"):
160
  gr.Markdown("### CSV 파일 μ—…λ‘œλ“œ 및 Parquet λ³€ν™˜")
161
  with gr.Row():
@@ -177,7 +176,7 @@ with gr.Blocks(theme="Nymbo/Nymbo_Theme",) as demo:
177
 
178
  gr.Markdown("## 주의 사항")
179
  gr.Markdown("""
180
- - **CSV μ—…λ‘œλ“œ**: CSV νŒŒμΌμ„ μ—…λ‘œλ“œν•˜λ©΄ μžλ™μœΌλ‘œ Parquet 파일둜 λ³€ν™˜λ©λ‹ˆλ‹€.
181
  - **Parquet 미리보기**: μ—…λ‘œλ“œλœ Parquet 파일의 첫 10개 행이 미리보기둜 ν‘œμ‹œλ©λ‹ˆλ‹€.
182
  - **LLM과의 λŒ€ν™”**: λ³€ν™˜λœ Parquet 파일 λ‚΄μš©μ„ 기반으둜 LLM이 응닡을 μƒμ„±ν•©λ‹ˆλ‹€.
183
  """)
 
42
  message,
43
  history: List[Tuple[str, str]],
44
  system_message="", # κΈ°λ³Έκ°’ μΆ”κ°€
45
+ max_tokens=4000, # κΈ°λ³Έκ°’ λ³€κ²½
46
+ temperature=0.7, # κΈ°λ³Έκ°’ μœ μ§€
47
+ top_p=0.9, # κΈ°λ³Έκ°’ μœ μ§€
48
+ ):
49
  global fashion_code, uhdimage_code, MixGEN_code, current_parquet_content
50
  system_message = system_message or ""
51
  system_prefix = """λ°˜λ“œμ‹œ ν•œκΈ€λ‘œ 닡변할것. λ„ˆλŠ” 주어진 μ†ŒμŠ€μ½”λ“œλ₯Ό 기반으둜 "μ„œλΉ„μŠ€ μ‚¬μš© μ„€λͺ… 및 μ•ˆλ‚΄, Q&Aλ₯Ό ν•˜λŠ” 역할이닀". μ•„μ£Ό μΉœμ ˆν•˜κ³  μžμ„Έν•˜κ²Œ 4000토큰 이상 Markdown ν˜•μ‹μœΌλ‘œ μž‘μ„±ν•˜λΌ. λ„ˆλŠ” μ½”λ“œλ₯Ό 기반으둜 μ‚¬μš© μ„€λͺ… 및 질의 응닡을 μ§„ν–‰ν•˜λ©°, μ΄μš©μžμ—κ²Œ 도움을 μ£Όμ–΄μ•Ό ν•œλ‹€. μ΄μš©μžκ°€ κΆκΈˆν•΄ ν•  λ§Œν•œ λ‚΄μš©μ— μΉœμ ˆν•˜κ²Œ μ•Œλ €μ£Όλ„λ‘ ν•˜λΌ. μ½”λ“œ 전체 λ‚΄μš©μ— λŒ€ν•΄μ„œλŠ” λ³΄μ•ˆμ„ μœ μ§€ν•˜κ³ , ν‚€ κ°’ 및 μ—”λ“œν¬μΈνŠΈμ™€ ꡬ체적인 λͺ¨λΈμ€ κ³΅κ°œν•˜μ§€ 마라."""
 
93
 
94
  def upload_csv(file):
95
  try:
96
+ # CSV 파일 읽기 (κ΅¬λΆ„μž 콀마)
97
+ df = pd.read_csv(file, sep=',')
98
 
99
  # CSV 파일의 컬럼 확인
100
  required_columns = {'id', 'text', 'label', 'metadata'}
 
127
  return f"CSV 파일 μ—…λ‘œλ“œ 및 λ³€ν™˜ 쀑 였λ₯˜κ°€ λ°œμƒν–ˆμŠ΅λ‹ˆλ‹€: {str(e)}", ""
128
 
129
  # Gradio Blocks μΈν„°νŽ˜μ΄μŠ€ μ„€μ •
130
+ with gr.Blocks() as demo:
131
  gr.Markdown("# LLM μ„œλΉ„μŠ€ μΈν„°νŽ˜μ΄μŠ€")
132
 
133
  with gr.Tab("챗봇"):
134
  gr.Markdown("### LLMκ³Ό λŒ€ν™”ν•˜κΈ°")
135
  chat = gr.ChatInterface(
136
+ fn=respond,
 
 
 
 
 
 
137
  examples=[
138
  ["νŒ¨μ…˜ μ½”λ“œ μ‹€ν–‰"],
139
  ["UHD 이미지 μ½”λ“œ μ‹€ν–‰"],
140
  ["MixGEN μ½”λ“œ μ‹€ν–‰"],
141
+ ["test.parquet μ‹€ν–‰"],
142
  ["μƒμ„Έν•œ μ‚¬μš© 방법을 마치 화면을 λ³΄λ©΄μ„œ μ„€λͺ…ν•˜λ“―이 4000 토큰 이상 μžμ„Ένžˆ μ„€λͺ…ν•˜λΌ"],
143
  ["FAQ 20건을 μƒμ„Έν•˜κ²Œ μž‘μ„±ν•˜λΌ. 4000토큰 이상 μ‚¬μš©ν•˜λΌ."],
144
  ["μ‚¬μš© 방법과 차별점, νŠΉμ§•, 강점을 μ€‘μ‹¬μœΌλ‘œ 4000 토큰 이상 유튜브 μ˜μƒ 슀크립트 ν˜•νƒœλ‘œ μž‘μ„±ν•˜λΌ"],
 
146
  ["νŠΉν—ˆ μΆœμ›μ— ν™œμš©ν•  기술 및 λΉ„μ¦ˆλ‹ˆμŠ€λͺ¨λΈ 츑면을 ν¬ν•¨ν•˜μ—¬ νŠΉν—ˆ μΆœμ›μ„œ ꡬ성에 맞게 ν˜μ‹ μ μΈ 창의 발λͺ… λ‚΄μš©μ„ μ€‘μ‹¬μœΌλ‘œ 4000 토큰 이상 μž‘μ„±ν•˜λΌ."],
147
  ["계속 μ΄μ–΄μ„œ λ‹΅λ³€ν•˜λΌ"],
148
  ],
149
+ theme="default", # ν…Œλ§ˆ λ³€κ²½ κ°€λŠ₯
 
150
  )
151
 
152
+ with gr.Accordion("μ‹œμŠ€ν…œ ν”„λ‘¬ν”„νŠΈ 및 μ˜΅μ…˜ μ„€μ •", open=False):
153
+ system_message = gr.Textbox(label="System Message", value="")
154
+ max_tokens = gr.Slider(minimum=1, maximum=8000, value=4000, label="Max Tokens")
155
+ temperature = gr.Slider(minimum=0, maximum=1, value=0.7, label="Temperature")
156
+ top_p = gr.Slider(minimum=0, maximum=1, value=0.9, label="Top P")
157
+
158
  with gr.Tab("데이터 λ³€ν™˜"):
159
  gr.Markdown("### CSV 파일 μ—…λ‘œλ“œ 및 Parquet λ³€ν™˜")
160
  with gr.Row():
 
176
 
177
  gr.Markdown("## 주의 사항")
178
  gr.Markdown("""
179
+ - **CSV μ—…λ‘œλ“œ**: CSV νŒŒμΌμ„ μ—…λ‘œλ“œν•˜λ©΄ μžλ™μœΌλ‘œ Parquet 파일둜 λ³€ν™˜λ©λ‹ˆλ‹€. CSV νŒŒμΌμ€ λ°˜λ“œμ‹œ **콀마(`,`)**둜 κ΅¬λΆ„λ˜μ–΄μ•Ό ν•©λ‹ˆλ‹€.
180
  - **Parquet 미리보기**: μ—…λ‘œλ“œλœ Parquet 파일의 첫 10개 행이 미리보기둜 ν‘œμ‹œλ©λ‹ˆλ‹€.
181
  - **LLM과의 λŒ€ν™”**: λ³€ν™˜λœ Parquet 파일 λ‚΄μš©μ„ 기반으둜 LLM이 응닡을 μƒμ„±ν•©λ‹ˆλ‹€.
182
  """)