llm-jp
/

llm-jp-3.1-1.8b-instruct4

Text Generation

text-generation-inference

Model card Files Files and versions Community

Taka008 commited on May 28

Commit

9eb06d0

·

verified ·

1 Parent(s): 5c2cf22

Update README.md

Files changed (1) hide show

README.md +2 -1

README.md CHANGED Viewed

@@ -27,12 +27,12 @@ LLM-jp-3.1 is the series of large language models developed by the [Research and
 The LLM-jp-3.1 series consists of models that have undergone mid-training ([instruction pre-training](https://aclanthology.org/2024.emnlp-main.148/)) based on the LLM-jp-3 series, resulting in a significant improvement in instruction-following capabilities compared to the original LLM-jp-3 models.
 This repository provides **llm-jp-3.1-1.8b-instruct4** model.
 For an overview of the LLM-jp-3.1 models across different parameter sizes, please refer to:
   - [LLM-jp-3.1 Pre-trained Models](https://huggingface.co/collections/llm-jp/llm-jp-31-pre-trained-models-68368787c32e462c40a45f7b)
   - [LLM-jp-3.1 Fine-tuned Models](https://huggingface.co/collections/llm-jp/llm-jp-31-fine-tuned-models-68368681b9b35de1c4ac8de4).
 Checkpoints format: Hugging Face Transformers
@@ -73,6 +73,7 @@ print(tokenizer.decode(output))
 ## Model Details
 - **Model type:** Transformer-based Language Model
 Dense model:
 |Params|Layers|Hidden size|Heads|Context length|Embedding parameters|Non-embedding parameters|

 The LLM-jp-3.1 series consists of models that have undergone mid-training ([instruction pre-training](https://aclanthology.org/2024.emnlp-main.148/)) based on the LLM-jp-3 series, resulting in a significant improvement in instruction-following capabilities compared to the original LLM-jp-3 models.
 This repository provides **llm-jp-3.1-1.8b-instruct4** model.
 For an overview of the LLM-jp-3.1 models across different parameter sizes, please refer to:
   - [LLM-jp-3.1 Pre-trained Models](https://huggingface.co/collections/llm-jp/llm-jp-31-pre-trained-models-68368787c32e462c40a45f7b)
   - [LLM-jp-3.1 Fine-tuned Models](https://huggingface.co/collections/llm-jp/llm-jp-31-fine-tuned-models-68368681b9b35de1c4ac8de4).
+For more details on training and evaluation results, please refer to [this blog post]() (in Japanese).
 Checkpoints format: Hugging Face Transformers
 ## Model Details
 - **Model type:** Transformer-based Language Model
+- **Architectures:**
 Dense model:
 |Params|Layers|Hidden size|Heads|Context length|Embedding parameters|Non-embedding parameters|