# import pandas as pd # import streamlit as st # from transformers import pipeline # from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, balanced_accuracy_score # # Charger le modèle pré-entraîné # classifier_model = "morit/french_xlm_xnli" # classifier = pipeline("zero-shot-classification", model=classifier_model) # # Charger les données depuis le fichier CSV # df = pd.read_csv("fic.csv",sep=";") # # Récupérer les commentaires en liste # comments = df["text"].tolist() # # Afficher l'entête # st.header("Analyse de Texte") # # Créer une selectbox pour choisir un commentaire # selected_comment = st.selectbox("Veuillez sélectionner un commentaire", comments) # # Afficher le commentaire sélectionné dans l'input text # text = st.text_area('Entrer le texte à analyser', value=selected_comment) # # Labels candidats pour la classification # candidate_labels = [0, 1] # # Modèle de phrase pour la formation de l'hypothèse # hypothesis_template = "Cet exemple est un commentaire {}." # # Exécuter la classification seulement si du texte est entré # if text and candidate_labels: # result = classifier(text, candidate_labels, hypothesis_template=hypothesis_template) # #st.info(f"Résultat: {result['labels'][0]} avec une confiance de {result['scores'][0]*100:.2f}%") # if result['labels'][0]==1: # st.info(f"Résultat: commentaire positive avec une confiance de {result['scores'][0]*100:.2f}%") # else: # st.info(f"Résultat: commentaire negative avec une confiance de {result['scores'][0]*100:.2f}%") # else: # st.write("Veuillez entrer du texte pour l'analyse.") # # Calculer les métriques de performance (vous devez ajuster ces lignes selon votre tâche) # if text and candidate_labels: # inputs = df["text"].tolist() # true_labels = df["label"].tolist() # predictions = classifier(inputs, candidate_labels, hypothesis_template=hypothesis_template) # predicted_labels = [result['labels'][0] for result in predictions] # accuracy = accuracy_score(true_labels, predicted_labels) # precision = precision_score(true_labels, predicted_labels, average='binary') # Si votre tâche est binaire # recall = recall_score(true_labels, predicted_labels, average='binary') # Si votre tâche est binaire # f1 = f1_score(true_labels, predicted_labels, average='binary') # Si votre tâche est binaire # balanced_accuracy = balanced_accuracy_score(true_labels, predicted_labels) # # Afficher les métriques sous forme de tableau # st.header("Métriques de Performance") # metrics_df = pd.DataFrame({ # "Métrique": ["Accuracy", "Precision", "Recall", "F1-score", "Balanced Accuracy"], # "Valeur": [accuracy, precision, recall, f1, balanced_accuracy] # }) # st.table(metrics_df) import pandas as pd import streamlit as st from transformers import pipeline from datasets import load_metric # Charger le modèle pré-entraîné classifier_model = "morit/french_xlm_xnli" classifier = pipeline("zero-shot-classification", model=classifier_model) # Charger les données depuis le fichier CSV df = pd.read_csv("fic.csv", sep=";") # Récupérer les commentaires en liste comments = df["text"].tolist() # Afficher l'entête st.header("Analyse de Texte") # Créer une selectbox pour choisir un commentaire selected_comment = st.selectbox("Veuillez sélectionner un commentaire", comments) # Afficher le commentaire sélectionné dans l'input text text = st.text_area('Entrer le texte à analyser', value=selected_comment) # Labels candidats pour la classification candidate_labels = [0, 1] # Modèle de phrase pour la formation de l'hypothèse hypothesis_template = "Cet exemple est un commentaire {}." # Exécuter la classification seulement si du texte est entré if text and candidate_labels: result = classifier(text, candidate_labels, hypothesis_template=hypothesis_template) if result['labels'][0] == 1: st.info(f"Résultat: commentaire positive avec une confiance de {result['scores'][0] * 100:.2f}%") else: st.info(f"Résultat: commentaire negative avec une confiance de {result['scores'][0] * 100:.2f}%") else: st.write("Veuillez entrer du texte pour l'analyse.") # Utiliser les métriques de Hugging Face if text and candidate_labels: inputs = df["text"].tolist() true_labels = df["label"].tolist() predictions = classifier(inputs, candidate_labels, hypothesis_template=hypothesis_template) predicted_labels = [result['labels'][0] for result in predictions] # Déclarer un tableau pour stocker les métriques metrics_table = [] # Calculer les métriques une par une et les ajouter au tableau precision = load_metric("precision") precision.add_batch(predictions=predicted_labels, references=true_labels) precision_result = precision.compute() metrics_table.append(("Precision", precision_result)) accuracy = load_metric("accuracy") accuracy.add_batch(predictions=predicted_labels, references=true_labels) accuracy_result = accuracy.compute() metrics_table.append(("Accuracy", accuracy_result)) recall = load_metric("recall") recall.add_batch(predictions=predicted_labels, references=true_labels) recall_result = recall.compute() metrics_table.append(("Recall", recall_result)) f1 = load_metric("f1") f1.add_batch(predictions=predicted_labels, references=true_labels) f1_result = f1.compute() metrics_table.append(("F1 Score", f1_result)) roc_auc = load_metric("roc_auc") roc_auc.add_batch(predictions=predicted_labels, references=true_labels) roc_auc_result = roc_auc.compute() metrics_table.append(("ROC-AUC Score", roc_auc_result)) # Afficher les métriques sous forme de tableau st.header("Métriques de Performance") metrics_df = pd.DataFrame(metrics_table, columns=["Métrique", "Valeur"]) st.table(metrics_df)