ShenaoZ
/

0.0001_gemmait_withdpo_4iters_bs256_555lr_iter_1

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

0.0001_gemmait_withdpo_4iters_bs256_555lr_iter_1

Commit History

End of training

58d2857
verified

ShenaoZ commited on May 6, 2024

Model save

d2f5189
verified

ShenaoZ commited on May 6, 2024

initial commit

b7c9c5c
verified

ShenaoZ commited on May 5, 2024