---
base_model: OrdalieTech/Solon-embeddings-large-0.1
library_name: sentence-transformers
pipeline_tag: sentence-similarity
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- generated_from_trainer
- dataset_size:66
- loss:MultipleNegativesRankingLoss
widget:
- source_sentence: conciliable
sentences:
- Révision générale des politiques publiques
- Qui est incapable d'être réconcilié, accordé ou convenu en raison de sa non-compliance
aux normes de confidentialité.
- Qui peut être réconcilié, accordé ou convenu.
- source_sentence: détournement
sentences:
- Se dit de deux événements ou actions qui se suivent immédiatement sans interruption.
- Le détournement désigne l'action de réaffecter des ressources financières ou matérielles
à une entité publique pour répondre à un besoin urgent et non prévu dans le budget
initial.
- utilisation d'argent, d'objets ou d'informations à une fin autre que celle prévue
à l'origine
- source_sentence: dies ad quem
sentences:
- Action d'invalider, de rendre inefficace ou non valide.
- Dies ad quem désigne en administration la date limite avant laquelle une action
ne doit pas être entreprise, afin de préserver l'intégrité d'un processus administratif
en cours.
- Dies ad quem est une expression latine utilisée en administration pour désigner
la date limite à laquelle une action peut être entreprise ou une décision peut
être prise.
- source_sentence: concertation
sentences:
- La concertation désigne le processus de sélection d'un nouveau responsable parmi
les membres d'une équipe, après avoir consulté l'opinion des supérieurs hiérarchiques.
- Discussion et échange d'idées entre différentes personnes ou groupes, dans le
but de prendre une décision ou de résoudre un problème.
- Domaine ou activité dans laquelle quelqu'un est particulièrement doué ou intéressé
- source_sentence: aléa
sentences:
- Un rappel est une action qui consiste à contacter une personne ou une entreprise
pour leur demander de régler une dette ou pour leur rappeler une obligation envers
vous.
- L'aléa désigne un événement prévu et certain qui est intégré dans une stratégie
de gestion des risques pour garantir le succès d'une décision administrative.
- Événement imprévu et incertain qui peut avoir un impact sur une situation ou une
décision
---
# SentenceTransformer based on OrdalieTech/Solon-embeddings-large-0.1
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [OrdalieTech/Solon-embeddings-large-0.1](https://huggingface.co/OrdalieTech/Solon-embeddings-large-0.1). It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
## Model Details
### Model Description
- **Model Type:** Sentence Transformer
- **Base model:** [OrdalieTech/Solon-embeddings-large-0.1](https://huggingface.co/OrdalieTech/Solon-embeddings-large-0.1)
- **Maximum Sequence Length:** 512 tokens
- **Output Dimensionality:** 1024 dimensions
- **Similarity Function:** Cosine Similarity
### Model Sources
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
### Full Model Architecture
```
SentenceTransformer(
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
(1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
```
## Usage
### Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
```bash
pip install -U sentence-transformers
```
Then you can load this model and run inference.
```python
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("Godefroyduchalard/solone-embedding-final1")
# Run inference
sentences = [
'aléa',
'Événement imprévu et incertain qui peut avoir un impact sur une situation ou une décision',
"L'aléa désigne un événement prévu et certain qui est intégré dans une stratégie de gestion des risques pour garantir le succès d'une décision administrative.",
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
```
## Training Details
### Training Dataset
#### Unnamed Dataset
* Size: 66 training samples
* Columns: anchor
, positive
, and negative
* Approximate statistics based on the first 66 samples:
| | anchor | positive | negative |
|:--------|:--------------------------------------------------------------------------------|:----------------------------------------------------------------------------------|:----------------------------------------------------------------------------------|
| type | string | string | string |
| details |
Odeadom
| Office de développement de l'économie agricole des départements d'outre-mer
| L'Office d'Eradication des Déchets Agricoles dans les Départements Métropolitains.
|
| OFII
| Office français de l'immigration et de l'intégration
| L'Office français de l'immigration et de l'intégration est un organisme chargé de faciliter les déplacements internationaux des entreprises françaises à travers le monde.
|
| Ofpra
| Office français de protection des réfugiés et apatrides
| L'Ofpra est un organisme chargé de l'évaluation et du contrôle des demandes d'asile présentées par les étrangers qui souhaitent s'installer en France, tout en veillant à ce que ces derniers ne représentent pas une menace pour la sécurité nationale.
|
* Loss: [MultipleNegativesRankingLoss
](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
```json
{
"scale": 20.0,
"similarity_fct": "cos_sim"
}
```
### Evaluation Dataset
#### Unnamed Dataset
* Size: 100 evaluation samples
* Columns: anchor
, positive
, and negative
* Approximate statistics based on the first 100 samples:
| | anchor | positive | negative |
|:--------|:--------------------------------------------------------------------------------|:----------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------|
| type | string | string | string |
| details | discriminatoire
| Se dit d'une action ou d'une décision qui traite une personne ou un groupe de manière injuste en se basant sur des critères tels que l'âge, le genre, l'origine ethnique, etc.
| Le terme "discriminatoire" désigne une action ou décision qui favorise et protège les droits des personnes ou groupes marginalisés, en particulier dans le contexte de la protection de l'environnement.
|
| criminelle
| Qui se rapporte à un crime ou à son exécution.
| Qui est responsable d'assurer le respect des lois et règlements dans un contexte sportif ou ludique.
|
| liquidité
| La liquidité est la facilité avec laquelle un actif peut être converti en espèces ou en équivalent liquide sans perdre de valeur.
| La liquidité est le processus de détermination des coûts indirects d'une entreprise, qui consiste à évaluer les dépenses non directement liées aux produits ou services offerts.
|
* Loss: [MultipleNegativesRankingLoss
](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
```json
{
"scale": 20.0,
"similarity_fct": "cos_sim"
}
```
### Training Hyperparameters
#### Non-Default Hyperparameters
- `eval_strategy`: steps
- `per_device_train_batch_size`: 16
- `per_device_eval_batch_size`: 16
- `learning_rate`: 0.1
- `num_train_epochs`: 10
- `warmup_ratio`: 0.1
- `fp16`: True
- `batch_sampler`: no_duplicates
#### All Hyperparameters