EQUES
/

TinySwallow-Stratos-1.5B

Model card Files Files and versions Community

stardust-eques commited on Feb 15

Commit

f19e4fd

·

verified ·

1 Parent(s): 8d55fd3

Update README.md

Files changed (1) hide show

README.md +4 -1

README.md CHANGED Viewed

@@ -9,7 +9,10 @@ datasets:
 # TinySwallow-Stratos-1.5B
 [SakanaAI/TinySwallow-1.5B-Instruct](https://huggingface.co/SakanaAI/TinySwallow-1.5B-Instruct)
-に対し[Stratos-35k](https://huggingface.co/datasets/bespokelabs/Bespoke-Stratos-35k)データセットを用いて学習を施した軽量なLLMです。
 ## TinySwallowとは
 SakanaAI社とSwallowチームによって開発された軽量なLLMです。新しい蒸留手法[TAID](https://arxiv.org/abs/2501.16937)が利用されています。

 # TinySwallow-Stratos-1.5B
 [SakanaAI/TinySwallow-1.5B-Instruct](https://huggingface.co/SakanaAI/TinySwallow-1.5B-Instruct)
+に対し[Stratos-35k](https://huggingface.co/datasets/bespokelabs/Bespoke-Stratos-35k)データセットを用いて学習を施した軽量なLLMです。
+ベースモデルの日本語対話能力を維持しつつ、算数などを解くためのreasoning能力の獲得を目指しています。
+限られた計算資源で擬似的にreasoning能力を向上させるアプローチとして、既存のreasoningモデルの出力データを用いたファインチューニングが着目されています。
 ## TinySwallowとは
 SakanaAI社とSwallowチームによって開発された軽量なLLMです。新しい蒸留手法[TAID](https://arxiv.org/abs/2501.16937)が利用されています。