sergeyzh commited on
Commit
254fd91
·
verified ·
1 Parent(s): a768e1b

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +11 -5
README.md CHANGED
@@ -25,12 +25,18 @@ base_model: cointegrated/rubert-tiny2
25
 
26
  На STS и близких задачах (PI, NLI, SA, TI) для русского языка превосходит по качеству LaBSE. Для работы с контекстом свыше 512 токенов требует дообучения под целевой домен.
27
 
 
 
 
 
 
 
28
  ## Быстрая модель для использования в составе RAG LLMs при инференсе на CPU:
29
- - отличный метрики на задачах STS, PI, NLI обеспечивают высокое качество при нечетких запросах;
30
- - средние показатели на задачах SA, TI снижают влияние авторского стиля и личного отношения автора на ембединг;
31
- - высокая скорость работы на CPU (> 1k предложений в секунду) позволяет легко расширять базу текстовых документов;
32
- - пониженная размерность эмбединга (312) ускоряет дальнейшую работу алгоритмов knn при поиске соответствий;
33
- - совместимость с [SentenceTransformer](https://github.com/UKPLab/sentence-transformers) позволяет проверить модель на своих данных с минимальным объемом кода.
34
 
35
  ## Использование модели с библиотекой `transformers`:
36
 
 
25
 
26
  На STS и близких задачах (PI, NLI, SA, TI) для русского языка превосходит по качеству LaBSE. Для работы с контекстом свыше 512 токенов требует дообучения под целевой домен.
27
 
28
+ ## Выбор модели из серии BERT-STS (качество/скорость)
29
+ | Рекомендуемая модель | CPU <br> (STS; snt/s) | GPU <br> (STS; snt/s) |
30
+ |:---------------------------------|:---------:|:---------:|
31
+ | Быстрая модель (скорость) | **rubert-tiny-sts <br> (0.797; 1190)** | - |
32
+ | Базовая модель (качество) | [rubert-mini-sts](https://huggingface.co/sergeyzh/rubert-mini-sts) <br> (0.815; 539) | [LaBSE-ru-sts](https://huggingface.co/sergeyzh/LaBSE-ru-sts) <br> (0.845; 1894) |
33
+
34
  ## Быстрая модель для использования в составе RAG LLMs при инференсе на CPU:
35
+ - высокое качество при нечетких запросах (отличный метрики на задачах STS, PI, NLI);
36
+ - низкое влияение эмоциональной окраски текста на ембединг (средние показатели на задачах SA, TI);
37
+ - легкое расширение базы текстовых документов (скорость работы на CPU > 1k предложений в секунду);
38
+ - ускорение алгоритмов knn при поиске соответствий (низкая размерность эмбединга 312);
39
+ - простота использования (совместимость с [SentenceTransformer](https://github.com/UKPLab/sentence-transformers)).
40
 
41
  ## Использование модели с библиотекой `transformers`:
42