shleeeee
/

mistral-ko-7b-wiki-neft

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

shleeeee commited on Nov 29, 2023

Commit

5e22bcb

·

1 Parent(s): 8f9af74

Create README.md

Files changed (1) hide show

README.md +44 -0

README.md ADDED Viewed

	@@ -0,0 +1,44 @@

+---
+language:
+- ko
+pipeline_tag: text-generation
+tags:
+- finetune
+---
+# Model Card for mistral-ko-7b-wiki-neft
+It is a fine-tuned model using Korean and NEFT in the mistral-7b model.
+## Model Details
+* **Model Developers** :  shleeeee(Seunghyeon Lee)
+* **Repository** : To be added
+* **Model Architecture** : The mistral-ko-7b-wiki-neft is is a fine-tuned version of the Mistral-7B-v0.1.
+* **Lora target modules** : q_proj, k_proj, v_proj, o_proj,gate_proj
+* **train_batch** : 4
+* **neftune_noise_alpha** : 5
+* **Max_step** : 1000
+## Dataset
+Korean Custom Dataset
+## Prompt template: Mistral
+```
+<s>[INST]{['instruction']}[/INST]{['output']}</s>
+```
+## Usage
+```
+# Load model directly
+from transformers import AutoTokenizer, AutoModelForCausalLM
+tokenizer = AutoTokenizer.from_pretrained("shleeeee/mistral-7b-wiki")
+model = AutoModelForCausalLM.from_pretrained("shleeeee/mistral-7b-wiki")
+# Use a pipeline as a high-level helper
+from transformers import pipeline
+pipe = pipeline("text-generation", model="shleeeee/mistral-7b-wiki")
+```
+## Evaluation
+- To be added