Update README.md
Browse files
README.md
CHANGED
@@ -9,7 +9,10 @@ datasets:
|
|
9 |
# TinySwallow-Stratos-1.5B
|
10 |
|
11 |
[SakanaAI/TinySwallow-1.5B-Instruct](https://huggingface.co/SakanaAI/TinySwallow-1.5B-Instruct)
|
12 |
-
に対し[Stratos-35k](https://huggingface.co/datasets/bespokelabs/Bespoke-Stratos-35k)データセットを用いて学習を施した軽量なLLMです。
|
|
|
|
|
|
|
13 |
|
14 |
## TinySwallowとは
|
15 |
SakanaAI社とSwallowチームによって開発された軽量なLLMです。新しい蒸留手法[TAID](https://arxiv.org/abs/2501.16937)が利用されています。
|
|
|
9 |
# TinySwallow-Stratos-1.5B
|
10 |
|
11 |
[SakanaAI/TinySwallow-1.5B-Instruct](https://huggingface.co/SakanaAI/TinySwallow-1.5B-Instruct)
|
12 |
+
に対し[Stratos-35k](https://huggingface.co/datasets/bespokelabs/Bespoke-Stratos-35k)データセットを用いて学習を施した軽量なLLMです。
|
13 |
+
ベースモデルの日本語対話能力を維持しつつ、算数などを解くためのreasoning能力の獲得を目指しています。
|
14 |
+
限られた計算資源で擬似的にreasoning能力を向上させるアプローチとして、既存のreasoningモデルの出力データを用いたファインチューニングが着目されています。
|
15 |
+
|
16 |
|
17 |
## TinySwallowとは
|
18 |
SakanaAI社とSwallowチームによって開発された軽量なLLMです。新しい蒸留手法[TAID](https://arxiv.org/abs/2501.16937)が利用されています。
|