Spaces:

ahmadouna
/

dev_NLP

Running

App Files Files Community

dev_NLP / app.py

ahmadouna

Update app.py

e2e2e22 verified over 1 year ago

raw

history blame

5.96 kB

	# import pandas as pd
	# import streamlit as st
	# from transformers import pipeline
	# from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, balanced_accuracy_score

	# # Charger le modèle pré-entraîné
	# classifier_model = "morit/french_xlm_xnli"
	# classifier = pipeline("zero-shot-classification", model=classifier_model)

	# # Charger les données depuis le fichier CSV
	# df = pd.read_csv("fic.csv",sep=";")
	# # Récupérer les commentaires en liste
	# comments = df["text"].tolist()

	# # Afficher l'entête
	# st.header("Analyse de Texte")

	# # Créer une selectbox pour choisir un commentaire
	# selected_comment = st.selectbox("Veuillez sélectionner un commentaire", comments)

	# # Afficher le commentaire sélectionné dans l'input text
	# text = st.text_area('Entrer le texte à analyser', value=selected_comment)

	# # Labels candidats pour la classification
	# candidate_labels = [0, 1]

	# # Modèle de phrase pour la formation de l'hypothèse
	# hypothesis_template = "Cet exemple est un commentaire {}."

	# # Exécuter la classification seulement si du texte est entré
	# if text and candidate_labels:
	# result = classifier(text, candidate_labels, hypothesis_template=hypothesis_template)

	# #st.info(f"Résultat: {result['labels'][0]} avec une confiance de {result['scores'][0]*100:.2f}%")
	# if result['labels'][0]==1:
	# st.info(f"Résultat: commentaire positive avec une confiance de {result['scores'][0]*100:.2f}%")
	# else:
	# st.info(f"Résultat: commentaire negative avec une confiance de {result['scores'][0]*100:.2f}%")
	# else:
	# st.write("Veuillez entrer du texte pour l'analyse.")

	# # Calculer les métriques de performance (vous devez ajuster ces lignes selon votre tâche)
	# if text and candidate_labels:
	# inputs = df["text"].tolist()
	# true_labels = df["label"].tolist()
	# predictions = classifier(inputs, candidate_labels, hypothesis_template=hypothesis_template)
	# predicted_labels = [result['labels'][0] for result in predictions]

	# accuracy = accuracy_score(true_labels, predicted_labels)
	# precision = precision_score(true_labels, predicted_labels, average='binary') # Si votre tâche est binaire
	# recall = recall_score(true_labels, predicted_labels, average='binary') # Si votre tâche est binaire
	# f1 = f1_score(true_labels, predicted_labels, average='binary') # Si votre tâche est binaire
	# balanced_accuracy = balanced_accuracy_score(true_labels, predicted_labels)

	# # Afficher les métriques sous forme de tableau
	# st.header("Métriques de Performance")
	# metrics_df = pd.DataFrame({
	# "Métrique": ["Accuracy", "Precision", "Recall", "F1-score", "Balanced Accuracy"],
	# "Valeur": [accuracy, precision, recall, f1, balanced_accuracy]
	# })
	# st.table(metrics_df)

	import pandas as pd
	import streamlit as st
	from transformers import pipeline
	from datasets import load_metric

	# Charger le modèle pré-entraîné
	classifier_model = "morit/french_xlm_xnli"
	classifier = pipeline("zero-shot-classification", model=classifier_model)

	# Charger les données depuis le fichier CSV
	df = pd.read_csv("fic.csv", sep=";")
	# Récupérer les commentaires en liste
	comments = df["text"].tolist()

	# Afficher l'entête
	st.header("Analyse de Texte")

	# Créer une selectbox pour choisir un commentaire
	selected_comment = st.selectbox("Veuillez sélectionner un commentaire", comments)

	# Afficher le commentaire sélectionné dans l'input text
	text = st.text_area('Entrer le texte à analyser', value=selected_comment)

	# Labels candidats pour la classification
	candidate_labels = [0, 1]

	# Modèle de phrase pour la formation de l'hypothèse
	hypothesis_template = "Cet exemple est un commentaire {}."

	# Exécuter la classification seulement si du texte est entré
	if text and candidate_labels:
	result = classifier(text, candidate_labels, hypothesis_template=hypothesis_template)

	if result['labels'][0] == 1:
	st.info(f"Résultat: commentaire positive avec une confiance de {result['scores'][0] * 100:.2f}%")
	else:
	st.info(f"Résultat: commentaire negative avec une confiance de {result['scores'][0] * 100:.2f}%")
	else:
	st.write("Veuillez entrer du texte pour l'analyse.")

	# Utiliser les métriques de Hugging Face
	if text and candidate_labels:
	inputs = df["text"].tolist()
	true_labels = df["label"].tolist()
	predictions = classifier(inputs, candidate_labels, hypothesis_template=hypothesis_template)
	predicted_labels = [result['labels'][0] for result in predictions]

	# Déclarer un tableau pour stocker les métriques
	metrics_table = []

	# Calculer les métriques une par une et les ajouter au tableau
	precision = load_metric("precision")
	precision.add_batch(predictions=predicted_labels, references=true_labels)
	precision_result = precision.compute()
	metrics_table.append(("Precision", precision_result))

	accuracy = load_metric("accuracy")
	accuracy.add_batch(predictions=predicted_labels, references=true_labels)
	accuracy_result = accuracy.compute()
	metrics_table.append(("Accuracy", accuracy_result))

	recall = load_metric("recall")
	recall.add_batch(predictions=predicted_labels, references=true_labels)
	recall_result = recall.compute()
	metrics_table.append(("Recall", recall_result))

	f1 = load_metric("f1")
	f1.add_batch(predictions=predicted_labels, references=true_labels)
	f1_result = f1.compute()
	metrics_table.append(("F1 Score", f1_result))

	roc_auc = load_metric("roc_auc")
	roc_auc.add_batch(predictions=predicted_labels, references=true_labels)
	roc_auc_result = roc_auc.compute()
	metrics_table.append(("ROC-AUC Score", roc_auc_result))

	# Afficher les métriques sous forme de tableau
	st.header("Métriques de Performance")
	metrics_df = pd.DataFrame(metrics_table, columns=["Métrique", "Valeur"])
	st.table(metrics_df)