Spaces:
Running
Running
# import pandas as pd | |
# import streamlit as st | |
# from transformers import pipeline | |
# from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, balanced_accuracy_score | |
# # Charger le modèle pré-entraîné | |
# classifier_model = "morit/french_xlm_xnli" | |
# classifier = pipeline("zero-shot-classification", model=classifier_model) | |
# # Charger les données depuis le fichier CSV | |
# df = pd.read_csv("fic.csv",sep=";") | |
# # Récupérer les commentaires en liste | |
# comments = df["text"].tolist() | |
# # Afficher l'entête | |
# st.header("Analyse de Texte") | |
# # Créer une selectbox pour choisir un commentaire | |
# selected_comment = st.selectbox("Veuillez sélectionner un commentaire", comments) | |
# # Afficher le commentaire sélectionné dans l'input text | |
# text = st.text_area('Entrer le texte à analyser', value=selected_comment) | |
# # Labels candidats pour la classification | |
# candidate_labels = [0, 1] | |
# # Modèle de phrase pour la formation de l'hypothèse | |
# hypothesis_template = "Cet exemple est un commentaire {}." | |
# # Exécuter la classification seulement si du texte est entré | |
# if text and candidate_labels: | |
# result = classifier(text, candidate_labels, hypothesis_template=hypothesis_template) | |
# #st.info(f"Résultat: {result['labels'][0]} avec une confiance de {result['scores'][0]*100:.2f}%") | |
# if result['labels'][0]==1: | |
# st.info(f"Résultat: commentaire positive avec une confiance de {result['scores'][0]*100:.2f}%") | |
# else: | |
# st.info(f"Résultat: commentaire negative avec une confiance de {result['scores'][0]*100:.2f}%") | |
# else: | |
# st.write("Veuillez entrer du texte pour l'analyse.") | |
# # Calculer les métriques de performance (vous devez ajuster ces lignes selon votre tâche) | |
# if text and candidate_labels: | |
# inputs = df["text"].tolist() | |
# true_labels = df["label"].tolist() | |
# predictions = classifier(inputs, candidate_labels, hypothesis_template=hypothesis_template) | |
# predicted_labels = [result['labels'][0] for result in predictions] | |
# accuracy = accuracy_score(true_labels, predicted_labels) | |
# precision = precision_score(true_labels, predicted_labels, average='binary') # Si votre tâche est binaire | |
# recall = recall_score(true_labels, predicted_labels, average='binary') # Si votre tâche est binaire | |
# f1 = f1_score(true_labels, predicted_labels, average='binary') # Si votre tâche est binaire | |
# balanced_accuracy = balanced_accuracy_score(true_labels, predicted_labels) | |
# # Afficher les métriques sous forme de tableau | |
# st.header("Métriques de Performance") | |
# metrics_df = pd.DataFrame({ | |
# "Métrique": ["Accuracy", "Precision", "Recall", "F1-score", "Balanced Accuracy"], | |
# "Valeur": [accuracy, precision, recall, f1, balanced_accuracy] | |
# }) | |
# st.table(metrics_df) | |
import pandas as pd | |
import streamlit as st | |
from transformers import pipeline | |
from datasets import load_metric | |
# Charger le modèle pré-entraîné | |
classifier_model = "morit/french_xlm_xnli" | |
classifier = pipeline("zero-shot-classification", model=classifier_model) | |
# Charger les données depuis le fichier CSV | |
df = pd.read_csv("fic.csv", sep=";") | |
# Récupérer les commentaires en liste | |
comments = df["text"].tolist() | |
# Afficher l'entête | |
st.header("Analyse de Texte") | |
# Créer une selectbox pour choisir un commentaire | |
selected_comment = st.selectbox("Veuillez sélectionner un commentaire", comments) | |
# Afficher le commentaire sélectionné dans l'input text | |
text = st.text_area('Entrer le texte à analyser', value=selected_comment) | |
# Labels candidats pour la classification | |
candidate_labels = [0, 1] | |
# Modèle de phrase pour la formation de l'hypothèse | |
hypothesis_template = "Cet exemple est un commentaire {}." | |
# Exécuter la classification seulement si du texte est entré | |
if text and candidate_labels: | |
result = classifier(text, candidate_labels, hypothesis_template=hypothesis_template) | |
if result['labels'][0] == 1: | |
st.info(f"Résultat: commentaire positive avec une confiance de {result['scores'][0] * 100:.2f}%") | |
else: | |
st.info(f"Résultat: commentaire negative avec une confiance de {result['scores'][0] * 100:.2f}%") | |
else: | |
st.write("Veuillez entrer du texte pour l'analyse.") | |
# Utiliser les métriques de Hugging Face | |
if text and candidate_labels: | |
inputs = df["text"].tolist() | |
true_labels = df["label"].tolist() | |
predictions = classifier(inputs, candidate_labels, hypothesis_template=hypothesis_template) | |
predicted_labels = [result['labels'][0] for result in predictions] | |
# Déclarer un tableau pour stocker les métriques | |
metrics_table = [] | |
# Calculer les métriques une par une et les ajouter au tableau | |
precision = load_metric("precision") | |
precision.add_batch(predictions=predicted_labels, references=true_labels) | |
precision_result = precision.compute() | |
metrics_table.append(("Precision", precision_result)) | |
accuracy = load_metric("accuracy") | |
accuracy.add_batch(predictions=predicted_labels, references=true_labels) | |
accuracy_result = accuracy.compute() | |
metrics_table.append(("Accuracy", accuracy_result)) | |
recall = load_metric("recall") | |
recall.add_batch(predictions=predicted_labels, references=true_labels) | |
recall_result = recall.compute() | |
metrics_table.append(("Recall", recall_result)) | |
f1 = load_metric("f1") | |
f1.add_batch(predictions=predicted_labels, references=true_labels) | |
f1_result = f1.compute() | |
metrics_table.append(("F1 Score", f1_result)) | |
roc_auc = load_metric("roc_auc") | |
roc_auc.add_batch(predictions=predicted_labels, references=true_labels) | |
roc_auc_result = roc_auc.compute() | |
metrics_table.append(("ROC-AUC Score", roc_auc_result)) | |
# Afficher les métriques sous forme de tableau | |
st.header("Métriques de Performance") | |
metrics_df = pd.DataFrame(metrics_table, columns=["Métrique", "Valeur"]) | |
st.table(metrics_df) | |