Spaces:

la04
/

RAG_test_1

Sleeping

la04 commited on Jan 10

Commit

15da3c5

verified ·

1 Parent(s): d14d249

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -42,6 +42,8 @@ def initialize_database(list_file_obj):
 def initialize_llmchain(llm_model, temperature, max_tokens, top_k, vector_db):
     if vector_db is None:
         return None, "Fehler: Keine Vektordatenbank verfügbar."
     llm = HuggingFaceEndpoint(
         repo_id=llm_model,
         huggingfacehub_api_token=api_token,
@@ -89,7 +91,7 @@ def demo():
                 llm_btn = gr.Radio(["Flan-T5 Small", "Flan-T5 Base"], label="Verfügbare LLMs", value="Flan-T5 Small", type="index")
                 slider_temperature = gr.Slider(0.01, 1.0, 0.5, label="Temperature")
-                slider_maxtokens = gr.Slider(128, 2048, 512, label="Max Tokens")
                 slider_topk = gr.Slider(1, 10, 3, label="Top-k")
                 qachain_btn = gr.Button("Initialisiere QA-Chatbot")
                 llm_status = gr.Textbox(label="Chatbot-Status", value="Nicht initialisiert", interactive=False)

 def initialize_llmchain(llm_model, temperature, max_tokens, top_k, vector_db):
     if vector_db is None:
         return None, "Fehler: Keine Vektordatenbank verfügbar."
+    if max_tokens > 250:
+        max_tokens = 250  # Begrenze max_new_tokens, um Fehler zu vermeiden
     llm = HuggingFaceEndpoint(
         repo_id=llm_model,
         huggingfacehub_api_token=api_token,
                 llm_btn = gr.Radio(["Flan-T5 Small", "Flan-T5 Base"], label="Verfügbare LLMs", value="Flan-T5 Small", type="index")
                 slider_temperature = gr.Slider(0.01, 1.0, 0.5, label="Temperature")
+                slider_maxtokens = gr.Slider(1, 250, 128, label="Max Tokens")  # Begrenzung auf 250
                 slider_topk = gr.Slider(1, 10, 3, label="Top-k")
                 qachain_btn = gr.Button("Initialisiere QA-Chatbot")
                 llm_status = gr.Textbox(label="Chatbot-Status", value="Nicht initialisiert", interactive=False)