Training in progress, step 1000

Files changed (8) hide show

config.json CHANGED Viewed

@@ -19,7 +19,7 @@
   "decoder_layerdrop": 0.0,
   "decoder_layers": 6,
   "decoder_start_token_id": 50258,
-  "dropout": 0.0,
   "encoder_attention_heads": 8,
   "encoder_ffn_dim": 2048,
   "encoder_layerdrop": 0.0,
@@ -44,7 +44,7 @@
   "pad_token_id": 50257,
   "scale_embedding": false,
   "torch_dtype": "float32",
-  "transformers_version": "4.33.0.dev0",
   "use_cache": false,
   "use_weighted_layer_sum": false,
   "vocab_size": 51865

   "decoder_layerdrop": 0.0,
   "decoder_layers": 6,
   "decoder_start_token_id": 50258,
+  "dropout": 0.1,
   "encoder_attention_heads": 8,
   "encoder_ffn_dim": 2048,
   "encoder_layerdrop": 0.0,
   "pad_token_id": 50257,
   "scale_embedding": false,
   "torch_dtype": "float32",
+  "transformers_version": "4.37.2",
   "use_cache": false,
   "use_weighted_layer_sum": false,
   "vocab_size": 51865

merges.txt CHANGED Viewed

@@ -1,4 +1,5 @@
 #version: 0.2
 Ġ a
 Ġt h
 i n

 #version: 0.2
+Ġ t
 Ġ a
 Ġt h
 i n

model.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:cfbc913b6c134ef9f0d8af8b4a7244de3647a9a550453c6931aba4a17508dd45
+size 290403936

runs/Jan02_15-33-35_hyperion-255/events.out.tfevents.1735828554.hyperion-255 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:afbd5b1994f51e8d18f377aefe8fbbebe27479c5eb56b718d5b31e13dc93f265
+size 11334

special_tokens_map.json CHANGED Viewed

@@ -111,22 +111,28 @@
   "bos_token": {
     "content": "<|endoftext|>",
     "lstrip": false,
-    "normalized": true,
     "rstrip": false,
     "single_word": false
   },
   "eos_token": {
     "content": "<|endoftext|>",
     "lstrip": false,
-    "normalized": true,
     "rstrip": false,
     "single_word": false
   },
-  "pad_token": "<|endoftext|>",
   "unk_token": {
     "content": "<|endoftext|>",
     "lstrip": false,
-    "normalized": true,
     "rstrip": false,
     "single_word": false
   }

   "bos_token": {
     "content": "<|endoftext|>",
     "lstrip": false,
+    "normalized": false,
     "rstrip": false,
     "single_word": false
   },
   "eos_token": {
     "content": "<|endoftext|>",
     "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "<|endoftext|>",
+    "lstrip": false,
+    "normalized": false,
     "rstrip": false,
     "single_word": false
   },
   "unk_token": {
     "content": "<|endoftext|>",
     "lstrip": false,
+    "normalized": false,
     "rstrip": false,
     "single_word": false
   }

tokenizer.json CHANGED Viewed

@@ -64890,6 +64890,7 @@
       "<|endoftext|>": 50257
     },
     "merges": [
       "Ġ a",
       "Ġt h",
       "i n",

       "<|endoftext|>": 50257
     },
     "merges": [
+      "Ġ t",
       "Ġ a",
       "Ġt h",
       "i n",

tokenizer_config.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:462851ea6ba27350919f94fd8fccf35050109f12109e620d8876d366304b3add
-size 4155

 version https://git-lfs.github.com/spec/v1
+oid sha256:913b6a37bd83f134eb0cc4752da1a9318664f54c6a5bf91c328e767d527ae4e6
+size 4792