trl-lib
/

Qwen2-0.5B-DPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

qgallouedec HF Staff commited on Sep 27, 2024

Commit

6c744a6

·

verified ·

1 Parent(s): 623e295

End of training

Files changed (0) hide show