Spaces:

ahmadouna
/

dev_NLP

Running

File size: 5,959 Bytes

# import pandas as pd
# import streamlit as st
# from transformers import pipeline
# from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, balanced_accuracy_score

# # Charger le modèle pré-entraîné
# classifier_model = "morit/french_xlm_xnli"
# classifier = pipeline("zero-shot-classification", model=classifier_model)

# # Charger les données depuis le fichier CSV
# df = pd.read_csv("fic.csv",sep=";")
# # Récupérer les commentaires en liste
# comments = df["text"].tolist()

# # Afficher l'entête
# st.header("Analyse de Texte")

# # Créer une selectbox pour choisir un commentaire
# selected_comment = st.selectbox("Veuillez sélectionner un commentaire", comments)

# # Afficher le commentaire sélectionné dans l'input text
# text = st.text_area('Entrer le texte à analyser', value=selected_comment)

# # Labels candidats pour la classification
# candidate_labels = [0, 1]

# # Modèle de phrase pour la formation de l'hypothèse
# hypothesis_template = "Cet exemple est un commentaire {}."

# # Exécuter la classification seulement si du texte est entré
# if text and candidate_labels:
#     result = classifier(text, candidate_labels, hypothesis_template=hypothesis_template)
    
#     #st.info(f"Résultat: {result['labels'][0]} avec une confiance de {result['scores'][0]*100:.2f}%")
#     if result['labels'][0]==1:
#         st.info(f"Résultat: commentaire positive avec une confiance de {result['scores'][0]*100:.2f}%")
#     else:
#         st.info(f"Résultat: commentaire negative avec une confiance de {result['scores'][0]*100:.2f}%")
# else:
#     st.write("Veuillez entrer du texte pour l'analyse.")

# # Calculer les métriques de performance (vous devez ajuster ces lignes selon votre tâche)
# if text and candidate_labels:
#     inputs = df["text"].tolist()
#     true_labels = df["label"].tolist()
#     predictions = classifier(inputs, candidate_labels, hypothesis_template=hypothesis_template)
#     predicted_labels = [result['labels'][0] for result in predictions]
    
#     accuracy = accuracy_score(true_labels, predicted_labels)
#     precision = precision_score(true_labels, predicted_labels, average='binary')  # Si votre tâche est binaire
#     recall = recall_score(true_labels, predicted_labels, average='binary')  # Si votre tâche est binaire
#     f1 = f1_score(true_labels, predicted_labels, average='binary')  # Si votre tâche est binaire
#     balanced_accuracy = balanced_accuracy_score(true_labels, predicted_labels)

#     # Afficher les métriques sous forme de tableau
#     st.header("Métriques de Performance")
#     metrics_df = pd.DataFrame({
#         "Métrique": ["Accuracy", "Precision", "Recall", "F1-score", "Balanced Accuracy"],
#         "Valeur": [accuracy, precision, recall, f1, balanced_accuracy]
#     })
#     st.table(metrics_df)

import pandas as pd
import streamlit as st
from transformers import pipeline
from datasets import load_metric

# Charger le modèle pré-entraîné
classifier_model = "morit/french_xlm_xnli"
classifier = pipeline("zero-shot-classification", model=classifier_model)

# Charger les données depuis le fichier CSV
df = pd.read_csv("fic.csv", sep=";")
# Récupérer les commentaires en liste
comments = df["text"].tolist()

# Afficher l'entête
st.header("Analyse de Texte")

# Créer une selectbox pour choisir un commentaire
selected_comment = st.selectbox("Veuillez sélectionner un commentaire", comments)

# Afficher le commentaire sélectionné dans l'input text
text = st.text_area('Entrer le texte à analyser', value=selected_comment)

# Labels candidats pour la classification
candidate_labels = [0, 1]

# Modèle de phrase pour la formation de l'hypothèse
hypothesis_template = "Cet exemple est un commentaire {}."

# Exécuter la classification seulement si du texte est entré
if text and candidate_labels:
    result = classifier(text, candidate_labels, hypothesis_template=hypothesis_template)

    if result['labels'][0] == 1:
        st.info(f"Résultat: commentaire positive avec une confiance de {result['scores'][0] * 100:.2f}%")
    else:
        st.info(f"Résultat: commentaire negative avec une confiance de {result['scores'][0] * 100:.2f}%")
else:
    st.write("Veuillez entrer du texte pour l'analyse.")

# Utiliser les métriques de Hugging Face
if text and candidate_labels:
    inputs = df["text"].tolist()
    true_labels = df["label"].tolist()
    predictions = classifier(inputs, candidate_labels, hypothesis_template=hypothesis_template)
    predicted_labels = [result['labels'][0] for result in predictions]

    # Déclarer un tableau pour stocker les métriques
    metrics_table = []

    # Calculer les métriques une par une et les ajouter au tableau
    precision = load_metric("precision")
    precision.add_batch(predictions=predicted_labels, references=true_labels)
    precision_result = precision.compute()
    metrics_table.append(("Precision", precision_result))

    accuracy = load_metric("accuracy")
    accuracy.add_batch(predictions=predicted_labels, references=true_labels)
    accuracy_result = accuracy.compute()
    metrics_table.append(("Accuracy", accuracy_result))

    recall = load_metric("recall")
    recall.add_batch(predictions=predicted_labels, references=true_labels)
    recall_result = recall.compute()
    metrics_table.append(("Recall", recall_result))

    f1 = load_metric("f1")
    f1.add_batch(predictions=predicted_labels, references=true_labels)
    f1_result = f1.compute()
    metrics_table.append(("F1 Score", f1_result))

    roc_auc = load_metric("roc_auc")
    roc_auc.add_batch(predictions=predicted_labels, references=true_labels)
    roc_auc_result = roc_auc.compute()
    metrics_table.append(("ROC-AUC Score", roc_auc_result))

    # Afficher les métriques sous forme de tableau
    st.header("Métriques de Performance")
    metrics_df = pd.DataFrame(metrics_table, columns=["Métrique", "Valeur"])
    st.table(metrics_df)