sergeyzh
/

rubert-tiny-sts

@@ -25,12 +25,18 @@ base_model: cointegrated/rubert-tiny2
 На STS и близких задачах (PI, NLI, SA, TI) для русского языка превосходит по качеству LaBSE. Для работы с контекстом свыше 512 токенов требует дообучения под целевой домен.
 ## Быстрая модель для использования в составе RAG LLMs при инференсе на CPU:
-- отличный метрики на задачах STS, PI, NLI обеспечивают высокое качество при нечетких запросах;
-- средние показатели на задачах SA, TI снижают влияние авторского стиля и личного отношения автора на ембединг;
-- высокая скорость работы на CPU (> 1k предложений в секунду) позволяет легко расширять базу текстовых документов;
-- пониженная размерность эмбединга (312) ускоряет дальнейшую работу алгоритмов knn при поиске соответствий;
-- совместимость с [SentenceTransformer](https://github.com/UKPLab/sentence-transformers) позволяет проверить модель на своих данных с минимальным объемом кода.
 ## Использование модели с библиотекой `transformers`:

 На STS и близких задачах (PI, NLI, SA, TI) для русского языка превосходит по качеству LaBSE. Для работы с контекстом свыше 512 токенов требует дообучения под целевой домен.
+## Выбор модели из серии BERT-STS (качество/скорость)
+| Рекомендуемая модель                      | CPU  <br> (STS; snt/s) | GPU  <br> (STS; snt/s) |
+|:---------------------------------|:---------:|:---------:|
+| Быстрая модель (скорость) | **rubert-tiny-sts <br> (0.797; 1190)** | - |
+| Базовая модель  (качество) | [rubert-mini-sts](https://huggingface.co/sergeyzh/rubert-mini-sts) <br> (0.815; 539) | [LaBSE-ru-sts](https://huggingface.co/sergeyzh/LaBSE-ru-sts) <br> (0.845; 1894) |
 ## Быстрая модель для использования в составе RAG LLMs при инференсе на CPU:
+- высокое качество при нечетких запросах (отличный метрики на задачах STS, PI, NLI);
+- низкое влияение эмоциональной окраски текста на ембединг (средние показатели на задачах SA, TI);
+- легкое расширение базы текстовых документов (скорость работы на CPU > 1k предложений в секунду);
+- ускорение алгоритмов knn при поиске соответствий (низкая размерность эмбединга 312);
+- простота использования (совместимость с [SentenceTransformer](https://github.com/UKPLab/sentence-transformers)).
 ## Использование модели с библиотекой `transformers`: