SURESHBEEKHANI
/

llama_3_2_3B-dpo-rlhf-fine-tuning

Question Answering

Inference Endpoints

Model card Files Files and versions Community

llama_3_2_3B-dpo-rlhf-fine-tuning / config.json

Commit History

(Trained with Unsloth)

4792ef2
verified

SURESHBEEKHANI commited on 27 days ago