Spaces:
Sleeping
Sleeping
Update app.py
Browse files
app.py
CHANGED
@@ -66,9 +66,11 @@ def respond(message, history, system_message, max_new_tokens, temperature, top_p
|
|
66 |
print(error_msg)
|
67 |
yield error_msg
|
68 |
|
69 |
-
demo = gr.
|
70 |
-
respond,
|
71 |
-
|
|
|
|
|
72 |
gr.Textbox(
|
73 |
value="Ты дружелюбный и полезный ассистент. Отвечай обдуманно и по делу.",
|
74 |
label="System message"
|
@@ -95,15 +97,10 @@ demo = gr.ChatInterface(
|
|
95 |
label="Top-p (nucleus sampling)"
|
96 |
),
|
97 |
],
|
98 |
-
|
99 |
-
|
100 |
-
|
101 |
-
|
102 |
-
["Расскажи мне о себе"],
|
103 |
-
["Что ты умеешь делать?"]
|
104 |
-
],
|
105 |
-
cache_examples=False,
|
106 |
-
streaming=True # Включаем потоковый вывод в интерфейсе Gradio
|
107 |
)
|
108 |
|
109 |
# Запускаем приложение
|
|
|
66 |
print(error_msg)
|
67 |
yield error_msg
|
68 |
|
69 |
+
demo = gr.Interface(
|
70 |
+
fn=respond,
|
71 |
+
inputs=[
|
72 |
+
gr.Textbox(lines=2, label="Сообщение пользователя"),
|
73 |
+
gr.State(),
|
74 |
gr.Textbox(
|
75 |
value="Ты дружелюбный и полезный ассистент. Отвечай обдуманно и по делу.",
|
76 |
label="System message"
|
|
|
97 |
label="Top-p (nucleus sampling)"
|
98 |
),
|
99 |
],
|
100 |
+
outputs="text",
|
101 |
+
title="GGUF Chat Model",
|
102 |
+
description="Чат с GGUF моделью (LLight-3.2-3B-Instruct)",
|
103 |
+
live=True # Включаем потоковую генерацию ответа
|
|
|
|
|
|
|
|
|
|
|
104 |
)
|
105 |
|
106 |
# Запускаем приложение
|