dfurman
/

Qwen2-72B-Orpo-v0.1

Text Generation

text-generation-inference

Model card Files Files and versions Community

dfurman commited on Sep 26, 2024

Commit

2d8f444

·

verified ·

1 Parent(s): a9a0d61

Update README.md

Files changed (1) hide show

README.md +4 -1

README.md CHANGED Viewed

@@ -115,7 +115,10 @@ model-index:
 ## This finetune
-Qwen2-72B-Orpo-v0.1 is a QLoRA finetune of `Qwen/Qwen2-72B-Instruct` on 1.5k rows of `mlabonne/orpo-dpo-mix-40k`.
 ![image/png](https://cdn-uploads.huggingface.co/production/uploads/62afc20ca5bd7cef3e1ab3f4/CdV47RW1zjr7qvD073NkZ.png)

 ## This finetune
+Qwen2-72B-Orpo-v0.1 is a QLoRA finetune of `Qwen/Qwen2-72B-Instruct` on 1.5k rows of `mlabonne/orpo-dpo-mix-40k`. It was trained as a generalist language model for a variety of text generation use cases, including support of agentic capabilities, roleplaying, reasoning, multi-turn conversations, long context coherence, and more.
+Thanks to [mlabonne](https://huggingface.co/mlabonne), [Qwen](https://huggingface.com/Qwen), and all other contributors to the source dataset and base model.
 ![image/png](https://cdn-uploads.huggingface.co/production/uploads/62afc20ca5bd7cef3e1ab3f4/CdV47RW1zjr7qvD073NkZ.png)