Spaces:

Intel
/

intel-ai-enterprise-inference

Running

App Files Files Community

Benjamin Consolvo commited on Apr 29

Commit

fa5b702

1 Parent(s): 9b98cf2

get model names from client

Browse files

Files changed (2) hide show

app.py +40 -56
model_info.json +16 -16

app.py CHANGED Viewed

@@ -15,68 +15,52 @@ st.title("Intel® AI for Enterprise Inference")
 st.header("LLM chatbot")
 # Extract the keys (model names) from the JSON data
-model_names = list(endpoint_data.keys())
 with st.sidebar:
-    modelname = st.selectbox("Select a LLM model (Running on Intel® Gaudi®) ", model_names)
     st.write(f"You selected: {modelname}")
     st.button("Start New Chat", on_click=clear_chat)
-    try:
-        #if you can provide the API key in the HF settings under "Variables and secrets", you will not need to enter your OpenAI-compatible API key every time.
-        st.session_state.api_key = st.secrets["openai_apikey"]
-        st.session_state.base_url = os.environ.get("base_url")
-    except KeyError:
-    # Add a text input for the API key if not in session state
-        api_key = st.text_input("Enter your API Key", type="password")
-        if api_key:
-            st.session_state.api_key = api_key
-# Check if the API key is provided
-if "api_key" not in st.session_state or not st.session_state.api_key:
-    st.error("Please enter your API Key in the sidebar.")
-else:
-    try:
-        # endpoint = endpoint_data[modelname]
-        api_key = st.session_state.api_key
-        base_url = st.session_state.base_url
-        # base_url = endpoint
-        client = OpenAI(api_key=api_key, base_url=base_url)
-        # Extract the model name
-        models = client.models.list()
-        modelname = models.data[0].id
-        if "messages" not in st.session_state:
-            st.session_state.messages = []
-        for message in st.session_state.messages:
-            with st.chat_message(message["role"]):
-                st.markdown(message["content"])
-        if prompt := st.chat_input("What is up?"):
-            st.session_state.messages.append({"role": "user", "content": prompt})
-            with st.chat_message("user"):
-                st.markdown(prompt)
-            with st.chat_message("assistant"):
-                try:
-                    stream = client.chat.completions.create(
-                        model=modelname,
-                        messages=[
-                            {"role": m["role"], "content": m["content"]}
-                            for m in st.session_state.messages
-                        ],
-                        max_tokens=4096,
-                        stream=True,
-                    )
-                    response = st.write_stream(stream)
-                except Exception as e:
-                    st.error(f"An error occurred while generating the response: {e}")
-                    response = "An error occurred while generating the response."
-            st.session_state.messages.append({"role": "assistant", "content": response})
-    except KeyError as e:
-        st.error(f"Key error: {e}")
-    except Exception as e:
-        st.error(f"An unexpected error occurred: {e}")

 st.header("LLM chatbot")
 # Extract the keys (model names) from the JSON data
+# model_names = list(endpoint_data.keys())
 with st.sidebar:
+    #Enter openai_api key under "Secrets " in HF settings
+    #Enter base_url under "Variables" in HF settings
+    api_key = st.session_state.api_key = st.secrets["openai_apikey"]
+    base_url = st.session_state.base_url = os.environ.get("base_url")
+    client = OpenAI(api_key=api_key, base_url=base_url)
+    model_names = client.models.list()
+    modelname = st.selectbox("Select LLM model (Running on Intel® Gaudi®) ", model_names)
     st.write(f"You selected: {modelname}")
     st.button("Start New Chat", on_click=clear_chat)
+try:
+    if "messages" not in st.session_state:
+        st.session_state.messages = []
+    for message in st.session_state.messages:
+        with st.chat_message(message["role"]):
+            st.markdown(message["content"])
+    if prompt := st.chat_input("What is up?"):
+        st.session_state.messages.append({"role": "user", "content": prompt})
+        with st.chat_message("user"):
+            st.markdown(prompt)
+        with st.chat_message("assistant"):
+            try:
+                stream = client.chat.completions.create(
+                    model=modelname,
+                    messages=[
+                        {"role": m["role"], "content": m["content"]}
+                        for m in st.session_state.messages
+                    ],
+                    max_tokens=4096,
+                    stream=True,
+                )
+                response = st.write_stream(stream)
+            except Exception as e:
+                st.error(f"An error occurred while generating the response: {e}")
+                response = "An error occurred while generating the response."
+        st.session_state.messages.append({"role": "assistant", "content": response})
+except KeyError as e:
+    st.error(f"Key error: {e}")
+except Exception as e:
+    st.error(f"An unexpected error occurred: {e}")

model_info.json CHANGED Viewed

@@ -1,18 +1,18 @@
 {
-    "DENVR: meta-llama/Llama-3.3-70B-Instruct": "https://api.inference.denvrdata.com/v1/",
-    "DENVR: meta-llama/Meta-Llama-3.2-1B-Instruct": "https://api.inference.denvrdata.com/v1/",
-    "DENVR: meta-llama/Meta-Llama-3.2-3B-Instruct": "https://api.inference.denvrdata.com/v1/",
-    "DENVR: meta-llama/Meta-Llama-3.1-8B-Instruct": "https://api.inference.denvrdata.com/v1/",
-    "DENVR: meta-llama/Meta-Llama-3.1-70B-Instruct": "https://api.inference.denvrdata.com/v1/",
-    "DENVR: deepseek-ai/DeepSeek-R1-Distill-Llama-8B": "https://api.inference.denvrdata.com/v1/",
-    "DENVR: deepseek-ai/DeepSeek-R1-Distill-Llama-70B": "https://api.inference.denvrdata.com/v1/",
-    "DENVR: mistralai/Mistral-7B-Instruct-v0.2": "https://api.inference.denvrdata.com/v1/",
-    "DENVR: mistralai/Mistral-7B-Instruct-v0.1": "https://api.inference.denvrdata.com/v1/",
-    "DENVR: mistralai/Mixtral-8x7B-Instruct-v0.1": "https://api.inference.denvrdata.com/v1/",
-    "DENVR: tiiuae/Falcon3-7B-Instruct": "https://api.inference.denvrdata.com/v1/",
-    "DENVR: tiiuae/Falcon3-10B-Instruct": "https://api.inference.denvrdata.com/v1/",
-    "DENVR: tiiuae/Falcon3.1-74B-Instruct": "https://api.inference.denvrdata.com/v1/",
-    "DENVR: ALLaM/ALLaM-7B-Instruct-preview": "https://api.inference.denvrdata.com/v1/",
-    "DENVR: inceptionai/jais-adapted-70b-chat": "https://api.inference.denvrdata.com/v1/",
-    "DENVR: codellama/CodeLlama-34b-Instruct-hf": "https://api.inference.denvrdata.com/v1/"
 }

 {
+    "meta-llama/Llama-3.3-70B-Instruct": "https://api.inference.denvrdata.com/v1/",
+    "meta-llama/Meta-Llama-3.2-1B-Instruct": "https://api.inference.denvrdata.com/v1/",
+    "meta-llama/Meta-Llama-3.2-3B-Instruct": "https://api.inference.denvrdata.com/v1/",
+    "meta-llama/Meta-Llama-3.1-8B-Instruct": "https://api.inference.denvrdata.com/v1/",
+    "meta-llama/Meta-Llama-3.1-70B-Instruct": "https://api.inference.denvrdata.com/v1/",
+    "deepseek-ai/DeepSeek-R1-Distill-Llama-8B": "https://api.inference.denvrdata.com/v1/",
+    "deepseek-ai/DeepSeek-R1-Distill-Llama-70B": "https://api.inference.denvrdata.com/v1/",
+    "mistralai/Mistral-7B-Instruct-v0.2": "https://api.inference.denvrdata.com/v1/",
+    "mistralai/Mistral-7B-Instruct-v0.1": "https://api.inference.denvrdata.com/v1/",
+    "mistralai/Mixtral-8x7B-Instruct-v0.1": "https://api.inference.denvrdata.com/v1/",
+    "tiiuae/Falcon3-7B-Instruct": "https://api.inference.denvrdata.com/v1/",
+    "tiiuae/Falcon3-10B-Instruct": "https://api.inference.denvrdata.com/v1/",
+    "tiiuae/Falcon3.1-74B-Instruct": "https://api.inference.denvrdata.com/v1/",
+    "ALLaM/ALLaM-7B-Instruct-preview": "https://api.inference.denvrdata.com/v1/",
+    "inceptionai/jais-adapted-70b-chat": "https://api.inference.denvrdata.com/v1/",
+    "codellama/CodeLlama-34b-Instruct-hf": "https://api.inference.denvrdata.com/v1/"
 }