danielheinz
/

e5-base-sts-en-de

Feature Extraction

text-embeddings-inference

Model card Files Files and versions Community

danielheinz commited on Jan 14, 2024

Commit

9aaae0e

·

verified ·

1 Parent(s): 32dc0bc

Update README.md

Files changed (1) hide show

README.md +18 -0

README.md CHANGED Viewed

@@ -1,3 +1,21 @@
 ---
 license: mit
 ---

 ---
 license: mit
+datasets:
+- deutsche-telekom/ger-backtrans-paraphrase
+- paws-x
+- stsb_multi_mt
+language:
+- de
 ---
+The model is a [multilingual-e5-base](https://huggingface.co/intfloat/multilingual-e5-base) model fine-tuned with the task of semantic textual similarity in mind.
+## Model Training
+The model has been fine-tuned on the German subsets of the following datasets:
+- [German paraphrase corpus by Philip May](https://huggingface.co/datasets/deutsche-telekom/ger-backtrans-paraphrase)
+- [paws-x](https://huggingface.co/datasets/paws-x)
+- [stsb_multi_mt](https://huggingface.co/datasets/stsb_multi_mt)
+# Results
+The model achieves the following results:
+- 0.920 on stsb's validation subset
+- 0.904 on stsb's test subset