Mixtral-Chat

Sleeping

App Files Files

kamran-r123 commited on Feb 6, 2024

Commit

31ce914

verified ·

1 Parent(s): f04e617

Update app.py

Browse files

Files changed (1) hide show

app.py +5 -79

app.py CHANGED Viewed

@@ -1,27 +1,7 @@
-from huggingface_hub import InferenceClient
-import gradio as gr
 import requests
 import json
-client = InferenceClient("mistralai/Mixtral-8x7B-Instruct-v0.1")
-def google_search(query, **kwargs):
-    api_key = 'AIzaSyDseKKQCAUBmPidu_QapnpJCGLueDWYJbE'
-    cse_id = '001ae9bf840514e61'
-    service_url = 'https://www.googleapis.com/customsearch/v1'
-    params = {
-        'key': api_key,
-        'cx': cse_id,
-        'q': query,
-        **kwargs
-    }
-    response = requests.get(service_url, params=params)
-    if response.status_code == 200:
-        return json.loads(response.text)['items']
-    else:
-        print(f'Error: {response.status_code}')
-        return []
 def tokenize(text):
     return text
@@ -36,6 +16,7 @@ def format_prompt(message, history):
     return prompt
 def generate(prompt, history, system_prompt, temperature=0.2, max_new_tokens=512, top_p=0.95, repetition_penalty=1.0):
     temperature = float(temperature)
     if temperature < 1e-2:
         temperature = 1e-2
@@ -52,7 +33,7 @@ def generate(prompt, history, system_prompt, temperature=0.2, max_new_tokens=512
     formatted_prompt = format_prompt(f"{system_prompt}, {prompt}", history)
-    stream = client.text_generation(formatted_prompt, **generate_kwargs, stream=True, details=True, return_full_text=False)
     output = ""
     for response in stream:
@@ -61,66 +42,11 @@ def generate(prompt, history, system_prompt, temperature=0.2, max_new_tokens=512
         yield output
     return output
-def generateS(prompt, history, system_prompt, temperature=0.2, max_new_tokens=512, top_p=0.95, repetition_penalty=1.0):
-    stream = google_search(prompt)
-    output = ""
-    for response in stream:
-        output += json.dumps(response)
-        yield output
-    return output
-additional_inputs=[
-    gr.Textbox(
-        label="System Prompt",
-        max_lines=1,
-        interactive=True,
-    ),
-    gr.Slider(
-        label="Temperature",
-        value=0.2,
-        minimum=0.0,
-        maximum=1.0,
-        step=0.05,
-        interactive=True,
-        info="Higher values produce more diverse outputs",
-    ),
-    gr.Slider(
-        label="Max new tokens",
-        value=512,
-        minimum=0,
-        maximum=1048,
-        step=64,
-        interactive=True,
-        info="The maximum numbers of new tokens",
-    ),
-    gr.Slider(
-        label="Top-p (nucleus sampling)",
-        value=0.95,
-        minimum=0.0,
-        maximum=1,
-        step=0.05,
-        interactive=True,
-        info="Higher values sample more low-probability tokens",
-    ),
-    gr.Slider(
-        label="Repetition penalty",
-        value=1,
-        minimum=1.0,
-        maximum=2.0,
-        step=0.05,
-        interactive=True,
-        info="Penalize repeated tokens",
-    )
-]
-mychatbot = gr.Chatbot(
-    avatar_images=["./user.png", "./botm.png"], bubble_full_width=False, show_label=False, show_copy_button=True, likeable=False)
 demo = gr.ChatInterface(fn=generate,
-                        chatbot=mychatbot,
-                        additional_inputs=additional_inputs,
                         title="Kamran's Mixtral 8x7b Chat",
                         retry_btn=None,
                         undo_btn=None

+import kminterface
 import requests
 import json
 def tokenize(text):
     return text
     return prompt
 def generate(prompt, history, system_prompt, temperature=0.2, max_new_tokens=512, top_p=0.95, repetition_penalty=1.0):
+    print(type(history), history)
     temperature = float(temperature)
     if temperature < 1e-2:
         temperature = 1e-2
     formatted_prompt = format_prompt(f"{system_prompt}, {prompt}", history)
+    stream = kminterface.client.text_generation(formatted_prompt, **generate_kwargs, stream=True, details=True, return_full_text=False)
     output = ""
     for response in stream:
         yield output
     return output
 demo = gr.ChatInterface(fn=generate,
+                        chatbot=kminterface.mychatbot,
+                        additional_inputs=kminterface.additional_inputs,
                         title="Kamran's Mixtral 8x7b Chat",
                         retry_btn=None,
                         undo_btn=None