kevin009
/

minirewrite

Text Generation

text-generation-inference

Model card Files Files and versions Community

kevin009 commited on Jul 7, 2024

Commit

3b2f879

·

verified ·

1 Parent(s): 622b387

Update README.md

Files changed (1) hide show

README.md +10 -12

README.md CHANGED Viewed

@@ -12,31 +12,29 @@ tags:
 # Model Card: Minimalist Assistant
 ## Model Details
-- **Architecture**: 32k tokens, 32 layers
-- **Quantization**: 4-bit
-- **Base Model**: Mistral Instruct
-- **Tokenizer**: Custom (based on Mistral Instruct)
 ## Intended Use
 - As Editor Assistant for revision and paraphrasing
 ## Training Data
-- **Initial Training**: 14,000 conversations in minimalist style to ensure concise output
-- **Further Training**: 8,000 revision conversations to enhance rewriting and paraphrasing capabilities
 ## Performance and Limitations
-- **Strengths**:
-  - Optimized for generating concise content
-  - Specialized in rewriting and paraphrasing tasks
 - **Limitations**:
-  - May produce shorter outputs compared to standard models
-  - Potential biases from training data should be considered
 ## Ethical Considerations
 - Designed for daily use, potential biases from training data should be considered
-- Users should be aware of the model's focus on brevity and rewriting
 ## Additional Information
 - Fine-tuned to address limitations in writing tasks observed in other models
 - Personalized for everyday use cases
 - Motivation for development was to create a model better suited for writing tasks, as existing models were found lacking in this area

 # Model Card: Minimalist Assistant
 ## Model Details
+- **Base Model**: Mistral Instruct v2
+- **Tokenizer**: based on Mistral Instruction following
 ## Intended Use
 - As Editor Assistant for revision and paraphrasing
+- Avoids technical jargon in favor of clear and accessible language
 ## Training Data
+- **Initial Training**: 14,000 conversations in minimalist style and more accessible language
+  - Dataset: kevin009/system-defined-sft-llama3-14k
+- **Further Training**: 8,000 revision conversations to enhance rewriting and paraphrasing tasks.
 ## Performance and Limitations
 - **Limitations**:
+  - May produce shorter outputs compared to original version.
+  - Potential biases
 ## Ethical Considerations
 - Designed for daily use, potential biases from training data should be considered
+- The model does not have implemented safety measures to prevent generation of potentially harmful or offensive content
 ## Additional Information
 - Fine-tuned to address limitations in writing tasks observed in other models
 - Personalized for everyday use cases
 - Motivation for development was to create a model better suited for writing tasks, as existing models were found lacking in this area
+- SFT fine-tuned model