File size: 5,890 Bytes
e64ff87 04dc613 e64ff87 04dc613 e64ff87 04dc613 e64ff87 6a0591b e64ff87 04dc613 e64ff87 3718cae |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 |
# import pandas as pd
# import streamlit as st
# from transformers import pipeline
# from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, balanced_accuracy_score
# # Charger le modèle pré-entraîné
# classifier_model = "morit/french_xlm_xnli"
# #classifier_model ="MoritzLaurer/mDeBERTa-v3-base-xnli-multilingual-nli-2mil7"
# classifier = pipeline("zero-shot-classification", model=classifier_model)
# # Charger les données depuis le fichier CSV
# df = pd.read_csv("fic.csv",sep=";")
# # Récupérer les commentaires en liste
# comments = df["text"].tolist()
# # Afficher l'entête
# st.header("Analyse de Texte")
# # Créer une selectbox pour choisir un commentaire
# selected_comment = st.selectbox("Veuillez sélectionner un commentaire", comments)
# # Afficher le commentaire sélectionné dans l'input text
# text = st.text_area('Entrer le texte à analyser', value=selected_comment)
# # Labels candidats pour la classification
# candidate_labels = [1,0]
# # Modèle de phrase pour la formation de l'hypothèse
# hypothesis_template = "Cet exemple est un {}."
# # Exécuter la classification seulement si du texte est entré
# if text and candidate_labels:
# result = classifier(text, candidate_labels, hypothesis_template=hypothesis_template)
# #st.info(f"Résultat: {result['labels'][0]} avec une confiance de {result['scores'][0]*100:.2f}%")
# if result['labels'][0]==1:
# st.info(f"Résultat: commentaire positive avec une confiance de {result['scores'][0]*100:.2f}%")
# if result['labels'][0]==0:
# st.info(f"Résultat: commentaire negative avec une confiance de {result['scores'][0]*100:.2f}%")
# else:
# st.write("Veuillez entrer du texte pour l'analyse.")
# # Calculer les métriques de performance (vous devez ajuster ces lignes selon votre tâche)
# inputs = df["text"].tolist()
# true_labels = df["label"].tolist()
# predictions = classifier(inputs, candidate_labels, hypothesis_template=hypothesis_template)
# predicted_labels = [result['labels'][0] for result in predictions]
# accuracy = accuracy_score(true_labels, predicted_labels)
# precision = precision_score(true_labels, predicted_labels, average='binary')
# recall = recall_score(true_labels, predicted_labels, average='binary')
# f1 = f1_score(true_labels, predicted_labels, average='binary')
# balanced_accuracy = balanced_accuracy_score(true_labels, predicted_labels)
# # Afficher les métriques sous forme de tableau
# st.header("Métriques de Performance")
# metrics_df = pd.DataFrame({
# "Métrique": ["Accuracy", "Precision", "Recall", "F1-score", "Balanced Accuracy"],
# "Valeur": [accuracy, precision, recall, f1, balanced_accuracy]
# })
# st.table(metrics_df)
# # a continuer
import pandas as pd
import streamlit as st
from transformers import pipeline
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, balanced_accuracy_score
# Charger le modèle pré-entraîné
classifier_model = "morit/french_xlm_xnli"
classifier = pipeline("zero-shot-classification", model=classifier_model)
# Charger les données depuis le fichier CSV
df = pd.read_csv("fic.csv", sep=";")
# Récupérer les commentaires en liste
comments = df["text"].tolist()
# Afficher l'entête
st.header("Analyse de Texte")
# Créer une selectbox pour choisir un commentaire
selected_comment = st.selectbox("Veuillez sélectionner un commentaire", comments)
# Afficher le commentaire sélectionné dans l'input text
text = st.text_area('Entrer le texte à analyser', value=selected_comment)
# Labels candidats pour la classification
candidate_labels = [1, 0]
# Modèle de phrase pour la formation de l'hypothèse
hypothesis_template = "Cet exemple est un {}."
# Ajouter un bouton pour déclencher l'analyse
if st.button("Analyser le texte"):
if text and candidate_labels:
result = classifier(text, candidate_labels, hypothesis_template=hypothesis_template)
if result['labels'][0] == 1:
st.info(f"Résultat: commentaire positif avec une confiance de {result['scores'][0]*100:.2f}%")
if result['labels'][0] == 0:
st.info(f"Résultat: commentaire négatif avec une confiance de {result['scores'][0]*100:.2f}%")
else:
st.write("Veuillez entrer du texte pour l'analyse.")
# Calculer les métriques de performance (vous devez ajuster ces lignes selon votre tâche)
inputs = df["text"].tolist()
true_labels = df["label"].tolist()
predictions = classifier(inputs, candidate_labels, hypothesis_template=hypothesis_template)
predicted_labels = [result['labels'][0] for result in predictions]
accuracy = accuracy_score(true_labels, predicted_labels)
precision = precision_score(true_labels, predicted_labels, average='binary')
recall = recall_score(true_labels, predicted_labels, average='binary')
f1 = f1_score(true_labels, predicted_labels, average='binary')
balanced_accuracy = balanced_accuracy_score(true_labels, predicted_labels)
# Afficher les métriques sous forme de tableau
st.header("Métriques de Performance")
st.subheader("Elles sont evaluées sur des données labelisés")
metrics_df = pd.DataFrame({
"Métrique": ["Accuracy", "Precision", "Recall", "F1-score", "Balanced Accuracy"],
"Valeur": [accuracy, precision, recall, f1, balanced_accuracy]
})
st.table(metrics_df)
st.markdown("**Accuracy:L e ratio d'instances correctement predites surle ratio total**")
st.markdown("**Precision:Pourcentage de bonnes predictions positives sur le nombre de positifs**")
st.markdown("**Rappel:Pourcentage de bonnes predictions positives sur le total**")
st.markdown("**f1-score:Moyenne de la precision et du rappel**")
st.markdown("**Balanced-Accuracy:Moyenne des taux de vrais positifs pour chaque classe**")
|