myezrag

Running

ginipick commited on Oct 25, 2024

Commit

52a7d34

verified ·

1 Parent(s): 6311e3f

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -151,7 +151,7 @@ def preprocess_text_with_llm(input_text: str) -> str:
 - **데이터셋 형식:** `id,text,label,metadata`
 - **각 행은 새로운 줄로 구분되고**, 필드는 쉼표로 구분됩니다.
 - **텍스트나 다른 필드 내에 쉼표가 있을 경우**, 해당 필드를 큰따옴표(")로 감싸세요.
-- **필드 내에 큰따옴표가 있을 경우**, 백슬래시(\\)로 이스케이프 처리하세요. 예: \\"
 - 텍스트를 **의미 단위로 분할**하고, 각 문장에 대해 **1부터 시작하는 연속된 id**를 부여하세요.
 - 각 문장에 대해 **적절한 label(카테고리)**을 지정하세요. 예: "기술", "사회", "경제"
 - **metadata**에는 출처나 날짜 등의 추가 정보를 포함하세요.
@@ -176,7 +176,7 @@ def preprocess_text_with_llm(input_text: str) -> str:
         response = ""
         stream = hf_client.text_generation(
             prompt=system_prompt,
-            max_new_tokens=2000,
             temperature=0.5,
             top_p=0.9,
             stream=True,
@@ -221,6 +221,8 @@ textarea, input[type="text"] {
 }
 """
 # Gradio Blocks 인터페이스 설정
 with gr.Blocks(css=css) as demo:
     gr.Markdown("# My RAG: LLM이 나만의 데이터로 학습한 콘텐츠 생성/답변", elem_id="initial-description")

 - **데이터셋 형식:** `id,text,label,metadata`
 - **각 행은 새로운 줄로 구분되고**, 필드는 쉼표로 구분됩니다.
 - **텍스트나 다른 필드 내에 쉼표가 있을 경우**, 해당 필드를 큰따옴표(")로 감싸세요.
+- **필드 내에 큰따옴표가 있을 경우**, 백슬래시(\\)로 이스케이프 처리하세요. 예: \"
 - 텍스트를 **의미 단위로 분할**하고, 각 문장에 대해 **1부터 시작하는 연속된 id**를 부여하세요.
 - 각 문장에 대해 **적절한 label(카테고리)**을 지정하세요. 예: "기술", "사회", "경제"
 - **metadata**에는 출처나 날짜 등의 추가 정보를 포함하세요.
         response = ""
         stream = hf_client.text_generation(
             prompt=system_prompt,
+            max_new_tokens=4000,
             temperature=0.5,
             top_p=0.9,
             stream=True,
 }
 """
 # Gradio Blocks 인터페이스 설정
 with gr.Blocks(css=css) as demo:
     gr.Markdown("# My RAG: LLM이 나만의 데이터로 학습한 콘텐츠 생성/답변", elem_id="initial-description")