fhswf
/

tiny-stack-tokenizer

Model card Files Files and versions

pweb002 commited on 14 days ago

Commit

a148a53

·

verified ·

1 Parent(s): f1ffaf5

Upload 4 files

Switch to tiktoken encoding

Files changed (2) hide show

README.md +0 -1
config.json +1 -1

README.md CHANGED Viewed

@@ -3,7 +3,6 @@
 ByteLevel BPE tokenizer trained on fhswf/tiny-stack dataset.
 ## Usage
 ```python
 from tokenizers.implementations import ByteLevelBPETokenizer
 from tokenizers.processors import BertProcessing

 ByteLevel BPE tokenizer trained on fhswf/tiny-stack dataset.
 ## Usage
 ```python
 from tokenizers.implementations import ByteLevelBPETokenizer
 from tokenizers.processors import BertProcessing

config.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "vocab_size": 52000,
   "model_type": "gpt2",
   "min_frequency": 2,
   "special_tokens": [
     "<s>",

 {
   "model_type": "gpt2",
+  "vocab_size": 52000,
   "min_frequency": 2,
   "special_tokens": [
     "<s>",