Safetensors
qwen2
stardust-eques commited on
Commit
f19e4fd
·
verified ·
1 Parent(s): 8d55fd3

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +4 -1
README.md CHANGED
@@ -9,7 +9,10 @@ datasets:
9
  # TinySwallow-Stratos-1.5B
10
 
11
  [SakanaAI/TinySwallow-1.5B-Instruct](https://huggingface.co/SakanaAI/TinySwallow-1.5B-Instruct)
12
- に対し[Stratos-35k](https://huggingface.co/datasets/bespokelabs/Bespoke-Stratos-35k)データセットを用いて学習を施した軽量なLLMです。
 
 
 
13
 
14
  ## TinySwallowとは
15
  SakanaAI社とSwallowチームによって開発された軽量なLLMです。新しい蒸留手法[TAID](https://arxiv.org/abs/2501.16937)が利用されています。
 
9
  # TinySwallow-Stratos-1.5B
10
 
11
  [SakanaAI/TinySwallow-1.5B-Instruct](https://huggingface.co/SakanaAI/TinySwallow-1.5B-Instruct)
12
+ に対し[Stratos-35k](https://huggingface.co/datasets/bespokelabs/Bespoke-Stratos-35k)データセットを用いて学習を施した軽量なLLMです。
13
+ ベースモデルの日本語対話能力を維持しつつ、算数などを解くためのreasoning能力の獲得を目指しています。
14
+ 限られた計算資源で擬似的にreasoning能力を向上させるアプローチとして、既存のreasoningモデルの出力データを用いたファインチューニングが着目されています。
15
+
16
 
17
  ## TinySwallowとは
18
  SakanaAI社とSwallowチームによって開発された軽量なLLMです。新しい蒸留手法[TAID](https://arxiv.org/abs/2501.16937)が利用されています。