ksswaroop
/

LoRA-mistral-7b-instruct-v0.2-v2

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

ksswaroop commited on May 7

Commit

f55e4f0

·

verified ·

1 Parent(s): 1ffee43

Model save

Files changed (1) hide show

README.md +4 -4

README.md CHANGED Viewed

@@ -27,17 +27,17 @@ print(output["generated_text"])
 ## Training procedure
-[<img src="https://raw.githubusercontent.com/wandb/assets/main/wandb-github-badge-28.svg" alt="Visualize in Weights & Biases" width="150" height="24"/>](https://wandb.ai/saiswaroopk/huggingface/runs/hg17j6dw)
 This model was trained with SFT.
 ### Framework versions
-- TRL: 0.16.1
 - Transformers: 4.51.3
 - Pytorch: 2.6.0+cu124
-- Datasets: 3.5.0
 - Tokenizers: 0.21.1
 ## Citations
@@ -49,7 +49,7 @@ Cite TRL as:
 ```bibtex
 @misc{vonwerra2022trl,
 	title        = {{TRL: Transformer Reinforcement Learning}},
-	author       = {Leandro von Werra and Younes Belkada and Lewis Tunstall and Edward Beeching and Tristan Thrush and Nathan Lambert and Shengyi Huang and Kashif Rasul and Quentin Gallouédec},
 	year         = 2020,
 	journal      = {GitHub repository},
 	publisher    = {GitHub},

 ## Training procedure
+[<img src="https://raw.githubusercontent.com/wandb/assets/main/wandb-github-badge-28.svg" alt="Visualize in Weights & Biases" width="150" height="24"/>](https://wandb.ai/saiswaroopk/huggingface/runs/hfo53eqy)
 This model was trained with SFT.
 ### Framework versions
+- TRL: 0.17.0
 - Transformers: 4.51.3
 - Pytorch: 2.6.0+cu124
+- Datasets: 3.5.1
 - Tokenizers: 0.21.1
 ## Citations
 ```bibtex
 @misc{vonwerra2022trl,
 	title        = {{TRL: Transformer Reinforcement Learning}},
+	author       = {Leandro von Werra and Younes Belkada and Lewis Tunstall and Edward Beeching and Tristan Thrush and Nathan Lambert and Shengyi Huang and Kashif Rasul and Quentin Gallou{\'e}dec},
 	year         = 2020,
 	journal      = {GitHub repository},
 	publisher    = {GitHub},