Spaces:

Aliou12
/

Class_Clustering

Sleeping

App Files Files Community

Aliou12 commited on Feb 11

Commit

9cdd02f

verified ·

1 Parent(s): f586f9f

Update app.py

Browse files

Files changed (1) hide show

app.py +41 -45

app.py CHANGED Viewed

@@ -1,65 +1,63 @@
 import pandas as pd
 import gradio as gr
-# import joblib
 import numpy as np
 import plotly.express as px
-from sklearn.preprocessing import StandardScaler
-from sklearn.decomposition import PCA
-from sklearn.cluster import KMeans
-import sys
 import pickle
-# Charger les modèles
-with open("lg.pkl", "rb") as f:
-    model = pickle.load(f)
 with open("kmeans_model.pkl", "rb") as f:
     model_cluster = pickle.load(f)
 # Fonction de prédiction du diabète
 def predict_diabetes(pregnancies, glucose, blood_pressure, skin_thickness, insulin, bmi, dpf, age):
     input_data = np.array([[pregnancies, glucose, blood_pressure, skin_thickness, insulin, bmi, dpf, age]])
-    prediction = model.predict(input_data)[0]
     return "Diabétique" if prediction == 1 else "Non diabétique"
-# Fonction de visualisation des clusters
 def plot_clusters(selected_cluster):
-    np.random.seed(42)
-    pca_features = np.random.randn(100, 2)
-    clusters = np.random.randint(0, 5, size=100)
-    pca_df = pd.DataFrame(pca_features, columns=['PC1', 'PC2'])
-    pca_df['Cluster'] = clusters
-    if selected_cluster == "Tous":
-        selected_data = pca_df
-    else:
-        selected_data = pca_df[pca_df['Cluster'] == int(selected_cluster)]
     if selected_data.empty:
         return px.scatter(title="Aucun point à afficher")
     fig = px.scatter(selected_data, x='PC1', y='PC2', color=selected_data['Cluster'].astype(str),
                      title=f"Visualisation du Cluster {selected_cluster}", labels={'color': 'Cluster'})
     return fig
 # Fonction pour télécharger les clusters en CSV
 def download_clusters():
-    cluster_data = {
-        'PC1': np.random.randn(100),
-        'PC2': np.random.randn(100),
-        'Cluster': np.random.randint(0, 5, 100)
-    }
-    df_clusters = pd.DataFrame(cluster_data)
-    return df_clusters.to_csv(index=False), "clusters.csv"
-# Interface utilisateur avec Gradio
 with gr.Blocks() as app:
     gr.Markdown("## Application Machine Learning : Classification et Clustering")
-    # Section Classification
     gr.Markdown("### Prédiction du Diabète")
     with gr.Row():
         pregnancies = gr.Number(label="Grossesses")
@@ -72,23 +70,21 @@ with gr.Blocks() as app:
     with gr.Row():
         dpf = gr.Number(label="DPF")
         age = gr.Number(label="Âge")
     predict_button = gr.Button("Prédire")
     output_label = gr.Textbox(label="Résultat")
-    predict_button.click(fn=predict_diabetes,
-                         inputs=[pregnancies, glucose, blood_pressure, skin_thickness, insulin, bmi, dpf, age],
                          outputs=output_label)
-    # Section Clustering
     gr.Markdown("### Visualisation des Clusters des Réactions en Ligne")
-    cluster_selector = gr.Dropdown(["Tous"] + [str(i) for i in range(5)], label="Sélectionner un cluster")
     cluster_plot = gr.Plot()
-    def update_plot(selected_cluster):
-        return plot_clusters(selected_cluster)
-    cluster_selector.change(fn=update_plot, inputs=[cluster_selector], outputs=[cluster_plot])
     # Téléchargement des clusters
     download_button = gr.Button("Télécharger les clusters")

 import pandas as pd
 import gradio as gr
 import numpy as np
 import plotly.express as px
 import pickle
+from sklearn.preprocessing import StandardScaler
+# Charger les modèles sauvegardés
+with open("scaler.pkl", "rb") as f:
+    scaler = pickle.load(f)
+with open("pca_model.pkl", "rb") as f:
+    pca_model = pickle.load(f)
 with open("kmeans_model.pkl", "rb") as f:
     model_cluster = pickle.load(f)
+with open("lg.pkl", "rb") as f:
+    model_diabetes = pickle.load(f)
+# Charger le dataframe (assurez-vous de mettre le bon chemin vers votre fichier)
+df_scaled = pd.read_csv("data.csv")  # Remplacez par le chemin réel du fichier
 # Fonction de prédiction du diabète
 def predict_diabetes(pregnancies, glucose, blood_pressure, skin_thickness, insulin, bmi, dpf, age):
     input_data = np.array([[pregnancies, glucose, blood_pressure, skin_thickness, insulin, bmi, dpf, age]])
+    prediction = model_diabetes.predict(input_data)[0]  # Utilise le modèle de régression logistique pour prédire
     return "Diabétique" if prediction == 1 else "Non diabétique"
+# Fonction pour afficher les clusters
 def plot_clusters(selected_cluster):
+    # Appliquer PCA pour transformer les données en 2D
+    selected_data = pca_model.transform(df_scaled)
+    selected_data = pd.DataFrame(selected_data, columns=['PC1', 'PC2'])
+    # Prédire les clusters avec le modèle KMeans
+    selected_data['Cluster'] = model_cluster.predict(df_scaled)
+    # Filtrer par le cluster sélectionné (si "Tous" n'est pas choisi)
+    if selected_cluster != "Tous":
+        selected_data = selected_data[selected_data['Cluster'] == int(selected_cluster)]
     if selected_data.empty:
         return px.scatter(title="Aucun point à afficher")
+    # Créer le graphique avec Plotly
     fig = px.scatter(selected_data, x='PC1', y='PC2', color=selected_data['Cluster'].astype(str),
                      title=f"Visualisation du Cluster {selected_cluster}", labels={'color': 'Cluster'})
     return fig
 # Fonction pour télécharger les clusters en CSV
 def download_clusters():
+    return df.to_csv(index=False), "clusters.csv"
+# Interface utilisateur Gradio
 with gr.Blocks() as app:
     gr.Markdown("## Application Machine Learning : Classification et Clustering")
+    # **Section Classification**
     gr.Markdown("### Prédiction du Diabète")
     with gr.Row():
         pregnancies = gr.Number(label="Grossesses")
     with gr.Row():
         dpf = gr.Number(label="DPF")
         age = gr.Number(label="Âge")
     predict_button = gr.Button("Prédire")
     output_label = gr.Textbox(label="Résultat")
+    predict_button.click(fn=predict_diabetes,
+                         inputs=[pregnancies, glucose, blood_pressure, skin_thickness, insulin, bmi, dpf, age],
                          outputs=output_label)
+    # **Section Clustering**
     gr.Markdown("### Visualisation des Clusters des Réactions en Ligne")
+    cluster_selector = gr.Dropdown(["Tous"] + [str(i) for i in range(len(df['Cluster'].unique()))],
+                                   label="Sélectionner un cluster")
     cluster_plot = gr.Plot()
+    cluster_selector.change(fn=plot_clusters, inputs=[cluster_selector], outputs=[cluster_plot])
     # Téléchargement des clusters
     download_button = gr.Button("Télécharger les clusters")