SmallDoge
/

Doge-20M-Instruct

Question Answering

text-generation

Model card Files Files and versions Community

JingzeShi commited on Jan 31

Commit

2f95140

·

verified ·

1 Parent(s): ea6fe65

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -71,7 +71,7 @@ We build the Doge-Instruct by first SFT on [SmolTalk](https://huggingface.co/dat
 | Model | Training Data | Epochs | Content Length | LR | Batch Size | Precision |
 |---|---|---|---|---|---|---|
 | [Doge-20M-Instruct-SFT](https://huggingface.co/SmallDoge/Doge-20M-Instruct-SFT) | [HuggingFaceTB/smoltalk](https://huggingface.co/datasets/HuggingFaceTB/smoltalk) | 2 | 2048 | 8e-4 | 0.25M | bfloat16 |
-| [Doge-60M-Instruct](https://huggingface.co/SmallDoge/Doge-60M-Instruct) | [HuggingFaceTB/smoltalk](https://huggingface.co/datasets/HuggingFaceTB/smoltalk) | 2 | 2048 | 6e-4 | 0.25M | bfloat16 |
 **DPO**:
 | Model | Training Data | Epochs | Content Length | LR | Batch Size | Precision |

 | Model | Training Data | Epochs | Content Length | LR | Batch Size | Precision |
 |---|---|---|---|---|---|---|
 | [Doge-20M-Instruct-SFT](https://huggingface.co/SmallDoge/Doge-20M-Instruct-SFT) | [HuggingFaceTB/smoltalk](https://huggingface.co/datasets/HuggingFaceTB/smoltalk) | 2 | 2048 | 8e-4 | 0.25M | bfloat16 |
+| [Doge-60M-Instruct-SFT](https://huggingface.co/SmallDoge/Doge-60M-Instruct-SFT) | [HuggingFaceTB/smoltalk](https://huggingface.co/datasets/HuggingFaceTB/smoltalk) | 2 | 2048 | 6e-4 | 0.25M | bfloat16 |
 **DPO**:
 | Model | Training Data | Epochs | Content Length | LR | Batch Size | Precision |