File size: 5,890 Bytes
e64ff87
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
04dc613
 
 
 
 
 
 
 
 
 
e64ff87
04dc613
 
 
 
 
 
 
 
 
 
 
 
 
e64ff87
04dc613
 
 
 
e64ff87
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
6a0591b
 
e64ff87
04dc613
 
 
e64ff87
3718cae
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
# import pandas as pd
# import streamlit as st
# from transformers import pipeline
# from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, balanced_accuracy_score

# # Charger le modèle pré-entraîné
# classifier_model = "morit/french_xlm_xnli"
# #classifier_model ="MoritzLaurer/mDeBERTa-v3-base-xnli-multilingual-nli-2mil7"
# classifier = pipeline("zero-shot-classification", model=classifier_model)

# # Charger les données depuis le fichier CSV
# df = pd.read_csv("fic.csv",sep=";")
# # Récupérer les commentaires en liste
# comments = df["text"].tolist()

# # Afficher l'entête
# st.header("Analyse de Texte")

# # Créer une selectbox pour choisir un commentaire
# selected_comment = st.selectbox("Veuillez sélectionner un commentaire", comments)

# # Afficher le commentaire sélectionné dans l'input text
# text = st.text_area('Entrer le texte à analyser', value=selected_comment)

# # Labels candidats pour la classification
# candidate_labels = [1,0]

# # Modèle de phrase pour la formation de l'hypothèse
# hypothesis_template = "Cet exemple est un  {}."

# # Exécuter la classification seulement si du texte est entré
# if text and candidate_labels:
#     result = classifier(text, candidate_labels, hypothesis_template=hypothesis_template)
    
#     #st.info(f"Résultat: {result['labels'][0]} avec une confiance de {result['scores'][0]*100:.2f}%")
#     if result['labels'][0]==1:
#         st.info(f"Résultat: commentaire positive avec une confiance de {result['scores'][0]*100:.2f}%")
#     if result['labels'][0]==0:
#         st.info(f"Résultat: commentaire negative avec une confiance de {result['scores'][0]*100:.2f}%")
# else:
#     st.write("Veuillez entrer du texte pour l'analyse.")

# # Calculer les métriques de performance (vous devez ajuster ces lignes selon votre tâche)

# inputs = df["text"].tolist()
# true_labels = df["label"].tolist()
# predictions = classifier(inputs, candidate_labels, hypothesis_template=hypothesis_template)
# predicted_labels = [result['labels'][0] for result in predictions]
    
# accuracy = accuracy_score(true_labels, predicted_labels)
# precision = precision_score(true_labels, predicted_labels, average='binary')  
# recall = recall_score(true_labels, predicted_labels, average='binary')  
# f1 = f1_score(true_labels, predicted_labels, average='binary') 
# balanced_accuracy = balanced_accuracy_score(true_labels, predicted_labels)

# # Afficher les métriques sous forme de tableau
# st.header("Métriques de Performance")
# metrics_df = pd.DataFrame({
#         "Métrique": ["Accuracy", "Precision", "Recall", "F1-score", "Balanced Accuracy"],
#         "Valeur": [accuracy, precision, recall, f1, balanced_accuracy]
#     })
# st.table(metrics_df)
# # a continuer

import pandas as pd
import streamlit as st
from transformers import pipeline
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, balanced_accuracy_score

# Charger le modèle pré-entraîné
classifier_model = "morit/french_xlm_xnli"
classifier = pipeline("zero-shot-classification", model=classifier_model)

# Charger les données depuis le fichier CSV
df = pd.read_csv("fic.csv", sep=";")
# Récupérer les commentaires en liste
comments = df["text"].tolist()

# Afficher l'entête
st.header("Analyse de Texte")

# Créer une selectbox pour choisir un commentaire
selected_comment = st.selectbox("Veuillez sélectionner un commentaire", comments)

# Afficher le commentaire sélectionné dans l'input text
text = st.text_area('Entrer le texte à analyser', value=selected_comment)

# Labels candidats pour la classification
candidate_labels = [1, 0]

# Modèle de phrase pour la formation de l'hypothèse
hypothesis_template = "Cet exemple est un  {}."

# Ajouter un bouton pour déclencher l'analyse
if st.button("Analyser le texte"):
    if text and candidate_labels:
        result = classifier(text, candidate_labels, hypothesis_template=hypothesis_template)
        
        if result['labels'][0] == 1:
            st.info(f"Résultat: commentaire positif avec une confiance de {result['scores'][0]*100:.2f}%")
        if result['labels'][0] == 0:
            st.info(f"Résultat: commentaire négatif avec une confiance de {result['scores'][0]*100:.2f}%")
    else:
        st.write("Veuillez entrer du texte pour l'analyse.")

    # Calculer les métriques de performance (vous devez ajuster ces lignes selon votre tâche)
    inputs = df["text"].tolist()
    true_labels = df["label"].tolist()
    predictions = classifier(inputs, candidate_labels, hypothesis_template=hypothesis_template)
    predicted_labels = [result['labels'][0] for result in predictions]

    accuracy = accuracy_score(true_labels, predicted_labels)
    precision = precision_score(true_labels, predicted_labels, average='binary')
    recall = recall_score(true_labels, predicted_labels, average='binary')
    f1 = f1_score(true_labels, predicted_labels, average='binary')
    balanced_accuracy = balanced_accuracy_score(true_labels, predicted_labels)

    # Afficher les métriques sous forme de tableau
    st.header("Métriques de Performance")
    st.subheader("Elles sont evaluées sur des données labelisés")
    metrics_df = pd.DataFrame({
        "Métrique": ["Accuracy", "Precision", "Recall", "F1-score", "Balanced Accuracy"],
        "Valeur": [accuracy, precision, recall, f1, balanced_accuracy]
    })
    st.table(metrics_df)
    st.markdown("**Accuracy:L e ratio d'instances correctement predites surle ratio total**")
    st.markdown("**Precision:Pourcentage de bonnes predictions positives sur le nombre de positifs**")
    st.markdown("**Rappel:Pourcentage de bonnes predictions positives sur le total**")
    st.markdown("**f1-score:Moyenne de la precision et du rappel**")
    st.markdown("**Balanced-Accuracy:Moyenne des taux de vrais positifs pour chaque classe**")