RLHF-And-Friends
/

TLDR-Mistral-7B-SmallSFT-CoPPO

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

TLDR-Mistral-7B-SmallSFT-CoPPO

2 contributors

History: 3 commits

evgurov's picture

Update config.json

0986456 verified 16 days ago