Spaces:
Sleeping
Sleeping
File size: 5,181 Bytes
027912a aa47277 027912a aa47277 027912a aa47277 00f9049 aa47277 c99981b aa47277 c99981b aa47277 c99981b aa47277 027912a 13516a4 027912a aa47277 027912a aa47277 dde8a8e c99981b aa47277 027912a aa47277 027912a aa47277 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 |
# import pandas as pd
# import streamlit as st
# from transformers import pipeline
# from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, balanced_accuracy_score
# # Charger le modèle pré-entraîné
# classifier_model = "morit/french_xlm_xnli"
# classifier = pipeline("zero-shot-classification", model=classifier_model)
# # Charger les données depuis le fichier CSV
# df = pd.read_csv("fic.csv",sep=";")
# # Récupérer les commentaires en liste
# comments = df["text"].tolist()
# # Afficher l'entête
# st.header("Analyse de Texte")
# # Créer une selectbox pour choisir un commentaire
# selected_comment = st.selectbox("Veuillez sélectionner un commentaire", comments)
# # Afficher le commentaire sélectionné dans l'input text
# text = st.text_area('Entrer le texte à analyser', value=selected_comment)
# # Labels candidats pour la classification
# candidate_labels = [0, 1]
# # Modèle de phrase pour la formation de l'hypothèse
# hypothesis_template = "Cet exemple est un commentaire {}."
# # Exécuter la classification seulement si du texte est entré
# if text and candidate_labels:
# result = classifier(text, candidate_labels, hypothesis_template=hypothesis_template)
# #st.info(f"Résultat: {result['labels'][0]} avec une confiance de {result['scores'][0]*100:.2f}%")
# if result['labels'][0]==1:
# st.info(f"Résultat: commentaire positive avec une confiance de {result['scores'][0]*100:.2f}%")
# else:
# st.info(f"Résultat: commentaire negative avec une confiance de {result['scores'][0]*100:.2f}%")
# else:
# st.write("Veuillez entrer du texte pour l'analyse.")
# # Calculer les métriques de performance (vous devez ajuster ces lignes selon votre tâche)
# if text and candidate_labels:
# inputs = df["text"].tolist()
# true_labels = df["label"].tolist()
# predictions = classifier(inputs, candidate_labels, hypothesis_template=hypothesis_template)
# predicted_labels = [result['labels'][0] for result in predictions]
# accuracy = accuracy_score(true_labels, predicted_labels)
# precision = precision_score(true_labels, predicted_labels, average='binary') # Si votre tâche est binaire
# recall = recall_score(true_labels, predicted_labels, average='binary') # Si votre tâche est binaire
# f1 = f1_score(true_labels, predicted_labels, average='binary') # Si votre tâche est binaire
# balanced_accuracy = balanced_accuracy_score(true_labels, predicted_labels)
# # Afficher les métriques sous forme de tableau
# st.header("Métriques de Performance")
# metrics_df = pd.DataFrame({
# "Métrique": ["Accuracy", "Precision", "Recall", "F1-score", "Balanced Accuracy"],
# "Valeur": [accuracy, precision, recall, f1, balanced_accuracy]
# })
# st.table(metrics_df)
import pandas as pd
import streamlit as st
from transformers import pipeline
from datasets import load_metric
# Charger le modèle pré-entraîné
classifier_model = "morit/french_xlm_xnli"
classifier = pipeline("zero-shot-classification", model=classifier_model)
# Charger les données depuis le fichier CSV
df = pd.read_csv("fic.csv", sep=";")
# Récupérer les commentaires en liste
comments = df["text"].tolist()
# Afficher l'entête
st.header("Analyse de Texte")
# Créer une selectbox pour choisir un commentaire
selected_comment = st.selectbox("Veuillez sélectionner un commentaire", comments)
# Afficher le commentaire sélectionné dans l'input text
text = st.text_area('Entrer le texte à analyser', value=selected_comment)
# Labels candidats pour la classification
candidate_labels = [0, 1]
# Modèle de phrase pour la formation de l'hypothèse
hypothesis_template = "Cet exemple est un commentaire {}."
# Exécuter la classification seulement si du texte est entré
if text and candidate_labels:
result = classifier(text, candidate_labels, hypothesis_template=hypothesis_template)
if result['labels'][0] == 1:
st.info(f"Résultat: commentaire positive avec une confiance de {result['scores'][0] * 100:.2f}%")
else:
st.info(f"Résultat: commentaire negative avec une confiance de {result['scores'][0] * 100:.2f}%")
else:
st.write("Veuillez entrer du texte pour l'analyse.")
# Utiliser les métriques de Hugging Face
if text and candidate_labels:
inputs = df["text"].tolist()
true_labels = df["label"].tolist()
predictions = classifier(inputs, candidate_labels, hypothesis_template=hypothesis_template)
predicted_labels = [result['labels'][0] for result in predictions]
# Calculer les métriques de performance
metrics = load_metric("precision", "accuracy", "recall", "f1", "roc_auc")
metrics.add_batch(predictions=predicted_labels, references=true_labels)
results = metrics.compute()
# Afficher les métriques sous forme de tableau
st.header("Métriques de Performance")
metrics_df = pd.DataFrame({
"Métrique": ["Precision", "Accuracy", "Recall", "F1 Score", "ROC-AUC Score"],
"Valeur": [results["precision"], results["accuracy"], results["recall"], results["f1"], results["roc_auc"]]
})
st.table(metrics_df)
|