import streamlit as st st.set_page_config(page_title="Accueil",page_icon="🏠",layout="wide") st.write("# Guide sur l'évaluation des LLM ⚖️") st.markdown(""" """) st.markdown("""### Avant-propos""") st.success( """ Cette application propose une traduction en français du guide de [Clémentine Fourrier](https://github.com/huggingface/evaluation-guidebook) sur l'évaluation des LLM. Notez que dans ce guide, les textes sur fond vert sont des ajouts par le CATIE par rapport au guide original (par exemple des remarques ou indications liées à des choix de traduction) et que tout le reste provient du guide original. De plus, sauf mention contraire, l'ensemble des liens que vous trouverez dans le guide renvoient vers des ressources en langue anglaise. """) st.markdown(""" """) st.markdown(""" """) st.markdown( """ ### Introduction Si vous vous êtes déjà demandé comment vous assurer qu'un LLM fonctionne bien dans le cadre de votre tâche spécifique, ce guide est fait pour vous !
Il couvre les différentes façons d'évaluer un modèle, des guides sur la conception de vos propres évaluations, ainsi que des conseils et des astuces basés sur de l'expérience pratique. Que vous travailliez avec des modèles en production, que vous soyez chercheur ou amateur, j'espère que vous trouverez ce dont vous avez besoin ; et si ce n'est pas le cas, ouvrez une [*issue*](https://github.com/huggingface/evaluation-guidebook/issues) (pour suggérer des améliorations ou des ressources manquantes) et je complèterai le guide ! """, unsafe_allow_html=True) st.markdown(""" """) st.markdown(""" """) st.markdown( """ ### Comment lire ce guide - **Utilisateur débutant** :
Si vous ne connaissez rien à l'évaluation, vous devriez commencer par les sections « Bases » de chaque chapitre avant d'aller plus loin. Vous trouverez également des explications pour vous aider sur les sujets importants des LLM dans le chapitre « Connaissances générales ». Par exemple, comment fonctionne l'inférence des modèles et ce qu'est la tokenisation. - **Utilisateur avancé** :
Les sections les plus pratiques sont les « Conseils et astuces » de chaque chapitre, ainsi que chapitre « Dépannage ». Vous trouverez également des choses intéressantes dans les sections « Concevoir ». Dans le texte, les liens préfixés par une ⭐ sont des liens de qualité et dont la lecture est recommandée. Si vous voulez une introduction sur le sujet, vous pouvez lire cet [article de blog](https://huggingface.co/blog/clefourrier/llm-evaluation) sur comment et pourquoi nous faisons de l'évaluation ! """, unsafe_allow_html=True) st.markdown(""" """) st.markdown(""" """) st.markdown( """ ### Remerciements Ce guide a été fortement inspiré par le [ML Engineering Guidebook de Stas Bekman](https://github.com/stas00/ml-engineering) ! Merci pour cette ressource incroyable ! Un grand merci également à toutes les personnes qui ont inspiré ce guide à travers des discussions soit lors d'événements, soit en ligne, notamment et sans s'y limiter : - 🤝 Luca Soldaini, Kyle Lo et Ian Magnusson (Allen AI), Max Bartolo (Cohere), Kai Wu (Meta), Swyx et Alessio Fanelli (Latent Space Podcast), Hailey Schoelkopf (EleutherAI), Martin Signoux (Open AI), Moritz Hardt (Max Planck Institute), Ludwig Schmidt (Anthropic). - 🔥 les utilisateurs de l'[Open LLM Leaderboard](https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard#/) et de [Lighteval](https://github.com/huggingface/lighteval), qui ont souvent soulevé des points très intéressants dans les discussions - 🤗 les personnes d'Hugging Face, comme Lewis Tunstall, Omar Sanseviero, Arthur Zucker, Hynek Kydlíček, Guilherme Penedo et Thom Wolf, - bien sûr, mon équipe ❤️ qui s'occupe de l'évaluation et des classements, Nathan Habib et Alina Lozovskaya. """, unsafe_allow_html=True) st.markdown(""" """) st.markdown(""" """) st.markdown( """ ### Citation [![CC BY-NC-SA 4.0][cc-by-nc-sa-image]][cc-by-nc-sa] [cc-by-nc-sa]: http://creativecommons.org/licenses/by-nc-sa/4.0/ [cc-by-nc-sa-image]: https://licensebuttons.net/l/by-nc-sa/4.0/88x31.png [cc-by-nc-sa-shield]: https://img.shields.io/badge/License-CC-BY--NC--SA-4.0-lightgrey.svg ``` @misc{fourrier2024evaluation, author = {Clémentine Fourrier and The Hugging Face Community}, title = {LLM Evaluation Guidebook}, year = {2024}, journal = {GitHub repository}, url = {https://github.com/huggingface/evaluation-guidebook) } ``` """, unsafe_allow_html=True) st.markdown(""" """) st.markdown(""" """) st.markdown("""### Partenaires""") st.success("""Cette traduction a pu être effectuée grâce au soutien de nos partenaires, que nous remercions.""") st.image('./assets/logo_Europe_NA.png')