Update app.py
Browse files
app.py
CHANGED
@@ -151,7 +151,7 @@ def preprocess_text_with_llm(input_text: str) -> str:
|
|
151 |
- **데이터셋 형식:** `id,text,label,metadata`
|
152 |
- **각 행은 새로운 줄로 구분되고**, 필드는 쉼표로 구분됩니다.
|
153 |
- **텍스트나 다른 필드 내에 쉼표가 있을 경우**, 해당 필드를 큰따옴표(")로 감싸세요.
|
154 |
-
- **필드 내에 큰따옴표가 있을 경우**, 백슬래시(\\)로 이스케이프 처리하세요. 예:
|
155 |
- 텍스트를 **의미 단위로 분할**하고, 각 문장에 대해 **1부터 시작하는 연속된 id**를 부여하세요.
|
156 |
- 각 문장에 대해 **적절한 label(카테고리)**을 지정하세요. 예: "기술", "사회", "경제"
|
157 |
- **metadata**에는 출처나 날짜 등의 추가 정보를 포함하세요.
|
@@ -176,7 +176,7 @@ def preprocess_text_with_llm(input_text: str) -> str:
|
|
176 |
response = ""
|
177 |
stream = hf_client.text_generation(
|
178 |
prompt=system_prompt,
|
179 |
-
max_new_tokens=
|
180 |
temperature=0.5,
|
181 |
top_p=0.9,
|
182 |
stream=True,
|
@@ -221,6 +221,8 @@ textarea, input[type="text"] {
|
|
221 |
}
|
222 |
"""
|
223 |
|
|
|
|
|
224 |
# Gradio Blocks 인터페이스 설정
|
225 |
with gr.Blocks(css=css) as demo:
|
226 |
gr.Markdown("# My RAG: LLM이 나만의 데이터로 학습한 콘텐츠 생성/답변", elem_id="initial-description")
|
|
|
151 |
- **데이터셋 형식:** `id,text,label,metadata`
|
152 |
- **각 행은 새로운 줄로 구분되고**, 필드는 쉼표로 구분됩니다.
|
153 |
- **텍스트나 다른 필드 내에 쉼표가 있을 경우**, 해당 필드를 큰따옴표(")로 감싸세요.
|
154 |
+
- **필드 내에 큰따옴표가 있을 경우**, 백슬래시(\\)로 이스케이프 처리하세요. 예: \"
|
155 |
- 텍스트를 **의미 단위로 분할**하고, 각 문장에 대해 **1부터 시작하는 연속된 id**를 부여하세요.
|
156 |
- 각 문장에 대해 **적절한 label(카테고리)**을 지정하세요. 예: "기술", "사회", "경제"
|
157 |
- **metadata**에는 출처나 날짜 등의 추가 정보를 포함하세요.
|
|
|
176 |
response = ""
|
177 |
stream = hf_client.text_generation(
|
178 |
prompt=system_prompt,
|
179 |
+
max_new_tokens=4000,
|
180 |
temperature=0.5,
|
181 |
top_p=0.9,
|
182 |
stream=True,
|
|
|
221 |
}
|
222 |
"""
|
223 |
|
224 |
+
|
225 |
+
|
226 |
# Gradio Blocks 인터페이스 설정
|
227 |
with gr.Blocks(css=css) as demo:
|
228 |
gr.Markdown("# My RAG: LLM이 나만의 데이터로 학습한 콘텐츠 생성/답변", elem_id="initial-description")
|