JayR7 commited on Feb 20, 2024

Commit

e2dc7a4

verified ·

1 Parent(s): c97db81

Upload folder using huggingface_hub

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

distilbert-base-cased/README.md +112 -0
distilbert-base-cased/checkpoint-1000/config.json +57 -0
distilbert-base-cased/checkpoint-1000/model.safetensors +3 -0
distilbert-base-cased/checkpoint-1000/optimizer.pt +3 -0
distilbert-base-cased/checkpoint-1000/rng_state.pth +3 -0
distilbert-base-cased/checkpoint-1000/scheduler.pt +3 -0
distilbert-base-cased/checkpoint-1000/special_tokens_map.json +7 -0
distilbert-base-cased/checkpoint-1000/tokenizer.json +0 -0
distilbert-base-cased/checkpoint-1000/tokenizer_config.json +55 -0
distilbert-base-cased/checkpoint-1000/trainer_state.json +201 -0
distilbert-base-cased/checkpoint-1000/training_args.bin +3 -0
distilbert-base-cased/checkpoint-1000/vocab.txt +0 -0
distilbert-base-cased/checkpoint-1500/config.json +57 -0
distilbert-base-cased/checkpoint-1500/model.safetensors +3 -0
distilbert-base-cased/checkpoint-1500/optimizer.pt +3 -0
distilbert-base-cased/checkpoint-1500/rng_state.pth +3 -0
distilbert-base-cased/checkpoint-1500/scheduler.pt +3 -0
distilbert-base-cased/checkpoint-1500/special_tokens_map.json +7 -0
distilbert-base-cased/checkpoint-1500/tokenizer.json +0 -0
distilbert-base-cased/checkpoint-1500/tokenizer_config.json +55 -0
distilbert-base-cased/checkpoint-1500/trainer_state.json +291 -0
distilbert-base-cased/checkpoint-1500/training_args.bin +3 -0
distilbert-base-cased/checkpoint-1500/vocab.txt +0 -0
distilbert-base-cased/checkpoint-2000/config.json +57 -0
distilbert-base-cased/checkpoint-2000/model.safetensors +3 -0
distilbert-base-cased/checkpoint-2000/optimizer.pt +3 -0
distilbert-base-cased/checkpoint-2000/rng_state.pth +3 -0
distilbert-base-cased/checkpoint-2000/scheduler.pt +3 -0
distilbert-base-cased/checkpoint-2000/special_tokens_map.json +7 -0
distilbert-base-cased/checkpoint-2000/tokenizer.json +0 -0
distilbert-base-cased/checkpoint-2000/tokenizer_config.json +55 -0
distilbert-base-cased/checkpoint-2000/trainer_state.json +381 -0
distilbert-base-cased/checkpoint-2000/training_args.bin +3 -0
distilbert-base-cased/checkpoint-2000/vocab.txt +0 -0
distilbert-base-cased/checkpoint-2500/config.json +57 -0
distilbert-base-cased/checkpoint-2500/model.safetensors +3 -0
distilbert-base-cased/checkpoint-2500/optimizer.pt +3 -0
distilbert-base-cased/checkpoint-2500/rng_state.pth +3 -0
distilbert-base-cased/checkpoint-2500/scheduler.pt +3 -0
distilbert-base-cased/checkpoint-2500/special_tokens_map.json +7 -0
distilbert-base-cased/checkpoint-2500/tokenizer.json +0 -0
distilbert-base-cased/checkpoint-2500/tokenizer_config.json +55 -0
distilbert-base-cased/checkpoint-2500/trainer_state.json +471 -0
distilbert-base-cased/checkpoint-2500/training_args.bin +3 -0
distilbert-base-cased/checkpoint-2500/vocab.txt +0 -0
distilbert-base-cased/checkpoint-3000/config.json +57 -0
distilbert-base-cased/checkpoint-3000/model.safetensors +3 -0
distilbert-base-cased/checkpoint-3000/optimizer.pt +3 -0
distilbert-base-cased/checkpoint-3000/rng_state.pth +3 -0
distilbert-base-cased/checkpoint-3000/scheduler.pt +3 -0

distilbert-base-cased/README.md ADDED Viewed

	@@ -0,0 +1,112 @@

+---
+tags:
+- generated_from_trainer
+metrics:
+- precision
+- recall
+- f1
+- accuracy
+model-index:
+- name: distilbert-base-cased
+  results: []
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# distilbert-base-cased
+This model was trained from scratch on the None dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.0755
+- Precision: 0.9528
+- Recall: 0.9528
+- F1: 0.9528
+- Accuracy: 0.9528
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 2e-05
+- train_batch_size: 16
+- eval_batch_size: 16
+- seed: 42
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- num_epochs: 2
+### Training results
+| Training Loss | Epoch | Step | Validation Loss | Precision | Recall | F1     | Accuracy |
+|:-------------:|:-----:|:----:|:---------------:|:---------:|:------:|:------:|:--------:|
+| 0.7657        | 0.04  | 100  | 0.2461          | 0.8912    | 0.8912 | 0.8912 | 0.8912   |
+| 0.2295        | 0.08  | 200  | 0.1786          | 0.9193    | 0.9193 | 0.9193 | 0.9193   |
+| 0.1704        | 0.12  | 300  | 0.1497          | 0.9293    | 0.9293 | 0.9293 | 0.9293   |
+| 0.1618        | 0.16  | 400  | 0.1299          | 0.9360    | 0.9360 | 0.9360 | 0.9360   |
+| 0.1366        | 0.2   | 500  | 0.1322          | 0.9360    | 0.9360 | 0.9360 | 0.9360   |
+| 0.1252        | 0.24  | 600  | 0.1152          | 0.9404    | 0.9404 | 0.9404 | 0.9404   |
+| 0.1201        | 0.28  | 700  | 0.1068          | 0.9427    | 0.9427 | 0.9427 | 0.9427   |
+| 0.1192        | 0.32  | 800  | 0.1052          | 0.9439    | 0.9439 | 0.9439 | 0.9439   |
+| 0.1124        | 0.36  | 900  | 0.1028          | 0.9447    | 0.9447 | 0.9447 | 0.9447   |
+| 0.109         | 0.4   | 1000 | 0.0996          | 0.9459    | 0.9459 | 0.9459 | 0.9459   |
+| 0.1026        | 0.44  | 1100 | 0.0975          | 0.9460    | 0.9460 | 0.9460 | 0.9460   |
+| 0.0984        | 0.48  | 1200 | 0.0956          | 0.9475    | 0.9475 | 0.9475 | 0.9475   |
+| 0.1014        | 0.52  | 1300 | 0.0943          | 0.9480    | 0.9480 | 0.9480 | 0.9480   |
+| 0.1085        | 0.56  | 1400 | 0.0909          | 0.9477    | 0.9477 | 0.9477 | 0.9477   |
+| 0.0965        | 0.6   | 1500 | 0.0913          | 0.9481    | 0.9481 | 0.9481 | 0.9481   |
+| 0.0932        | 0.64  | 1600 | 0.0891          | 0.9485    | 0.9485 | 0.9485 | 0.9485   |
+| 0.0948        | 0.68  | 1700 | 0.0880          | 0.9489    | 0.9489 | 0.9489 | 0.9489   |
+| 0.0922        | 0.72  | 1800 | 0.0863          | 0.9493    | 0.9493 | 0.9493 | 0.9493   |
+| 0.0889        | 0.76  | 1900 | 0.0857          | 0.9499    | 0.9499 | 0.9499 | 0.9499   |
+| 0.0864        | 0.8   | 2000 | 0.0844          | 0.9502    | 0.9502 | 0.9502 | 0.9502   |
+| 0.0941        | 0.84  | 2100 | 0.0830          | 0.9503    | 0.9503 | 0.9503 | 0.9503   |
+| 0.0895        | 0.88  | 2200 | 0.0828          | 0.9505    | 0.9505 | 0.9505 | 0.9505   |
+| 0.088         | 0.92  | 2300 | 0.0827          | 0.9506    | 0.9506 | 0.9506 | 0.9506   |
+| 0.0881        | 0.96  | 2400 | 0.0835          | 0.9500    | 0.9500 | 0.9500 | 0.9500   |
+| 0.0842        | 1.0   | 2500 | 0.0818          | 0.9504    | 0.9504 | 0.9504 | 0.9504   |
+| 0.0767        | 1.04  | 2600 | 0.0839          | 0.9508    | 0.9508 | 0.9508 | 0.9508   |
+| 0.0793        | 1.08  | 2700 | 0.0823          | 0.9505    | 0.9505 | 0.9505 | 0.9505   |
+| 0.0788        | 1.12  | 2800 | 0.0822          | 0.9509    | 0.9509 | 0.9509 | 0.9509   |
+| 0.0724        | 1.16  | 2900 | 0.0809          | 0.9514    | 0.9514 | 0.9514 | 0.9514   |
+| 0.0749        | 1.2   | 3000 | 0.0806          | 0.9508    | 0.9508 | 0.9508 | 0.9508   |
+| 0.0741        | 1.24  | 3100 | 0.0798          | 0.9511    | 0.9511 | 0.9511 | 0.9511   |
+| 0.076         | 1.28  | 3200 | 0.0783          | 0.9517    | 0.9517 | 0.9517 | 0.9517   |
+| 0.0723        | 1.32  | 3300 | 0.0797          | 0.9517    | 0.9517 | 0.9517 | 0.9517   |
+| 0.0815        | 1.36  | 3400 | 0.0791          | 0.9520    | 0.9520 | 0.9520 | 0.9520   |
+| 0.0769        | 1.4   | 3500 | 0.0779          | 0.9524    | 0.9524 | 0.9524 | 0.9524   |
+| 0.0761        | 1.44  | 3600 | 0.0777          | 0.9527    | 0.9527 | 0.9527 | 0.9527   |
+| 0.0718        | 1.48  | 3700 | 0.0781          | 0.9520    | 0.9520 | 0.9520 | 0.9520   |
+| 0.0769        | 1.52  | 3800 | 0.0773          | 0.9526    | 0.9526 | 0.9526 | 0.9526   |
+| 0.0653        | 1.56  | 3900 | 0.0779          | 0.9520    | 0.9520 | 0.9520 | 0.9520   |
+| 0.0724        | 1.6   | 4000 | 0.0775          | 0.9522    | 0.9522 | 0.9522 | 0.9522   |
+| 0.0701        | 1.64  | 4100 | 0.0776          | 0.9522    | 0.9522 | 0.9522 | 0.9522   |
+| 0.0731        | 1.68  | 4200 | 0.0773          | 0.9523    | 0.9523 | 0.9523 | 0.9523   |
+| 0.07          | 1.72  | 4300 | 0.0772          | 0.9524    | 0.9524 | 0.9524 | 0.9524   |
+| 0.0721        | 1.76  | 4400 | 0.0769          | 0.9528    | 0.9528 | 0.9528 | 0.9528   |
+| 0.0736        | 1.8   | 4500 | 0.0765          | 0.9529    | 0.9529 | 0.9529 | 0.9529   |
+| 0.0721        | 1.84  | 4600 | 0.0762          | 0.9523    | 0.9523 | 0.9523 | 0.9523   |
+| 0.0763        | 1.88  | 4700 | 0.0758          | 0.9528    | 0.9528 | 0.9528 | 0.9528   |
+| 0.0683        | 1.92  | 4800 | 0.0759          | 0.9528    | 0.9528 | 0.9528 | 0.9528   |
+| 0.0772        | 1.96  | 4900 | 0.0755          | 0.9528    | 0.9528 | 0.9528 | 0.9528   |
+### Framework versions
+- Transformers 4.37.2
+- Pytorch 2.1.0+cu121
+- Datasets 2.17.1
+- Tokenizers 0.15.2

distilbert-base-cased/checkpoint-1000/config.json ADDED Viewed

	@@ -0,0 +1,57 @@

+{
+  "_name_or_path": "distilbert-base-cased",
+  "activation": "gelu",
+  "architectures": [
+    "DistilBertForTokenClassification"
+  ],
+  "attention_dropout": 0.1,
+  "dim": 768,
+  "dropout": 0.1,
+  "hidden_dim": 3072,
+  "id2label": {
+    "0": "B-ProductNameEn",
+    "1": "I-ProductNameEn",
+    "2": "B-TradeMarkEn",
+    "3": "I-TradeMarkEn",
+    "4": "B-Country",
+    "5": "I-Country",
+    "6": "B-HSCode",
+    "7": "I-HSCode",
+    "8": "B-HSCodeEn",
+    "9": "I-HSCodeEn",
+    "10": "B-ManufacturerEn",
+    "11": "I-ManufacturerEn",
+    "12": "B-ModelNo",
+    "13": "I-ModelNo"
+  },
+  "initializer_range": 0.02,
+  "label2id": {
+    "B-Country": 4,
+    "B-HSCode": 6,
+    "B-HSCodeEn": 8,
+    "B-ManufacturerEn": 10,
+    "B-ModelNo": 12,
+    "B-ProductNameEn": 0,
+    "B-TradeMarkEn": 2,
+    "I-Country": 5,
+    "I-HSCode": 7,
+    "I-HSCodeEn": 9,
+    "I-ManufacturerEn": 11,
+    "I-ModelNo": 13,
+    "I-ProductNameEn": 1,
+    "I-TradeMarkEn": 3
+  },
+  "max_position_embeddings": 512,
+  "model_type": "distilbert",
+  "n_heads": 12,
+  "n_layers": 6,
+  "output_past": true,
+  "pad_token_id": 0,
+  "qa_dropout": 0.1,
+  "seq_classif_dropout": 0.2,
+  "sinusoidal_pos_embds": false,
+  "tie_weights_": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.37.2",
+  "vocab_size": 28996
+}

distilbert-base-cased/checkpoint-1000/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6b6703f50fa88008f88ab717481d44ffc45cb8026595cce865da8941c586e356
+size 260819048

distilbert-base-cased/checkpoint-1000/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1fca981663ffcb9ae07a89a1a4e4dede55d09e512f9d18ae6b030afc8310dc5f
+size 521698874

distilbert-base-cased/checkpoint-1000/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fb9339a8cbb82ba5ee2f361dedf227b21ca995a5d566d33bd610f189892e2091
+size 14244

distilbert-base-cased/checkpoint-1000/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8adaa2d8045a871ac5d0f25de752ac87c7094e40a3cc90f08c7ddad38cba70de
+size 1064

distilbert-base-cased/checkpoint-1000/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

distilbert-base-cased/checkpoint-1000/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

distilbert-base-cased/checkpoint-1000/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": false,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "DistilBertTokenizer",
+  "unk_token": "[UNK]"
+}

distilbert-base-cased/checkpoint-1000/trainer_state.json ADDED Viewed

	@@ -0,0 +1,201 @@

+{
+  "best_metric": 0.0995732992887497,
+  "best_model_checkpoint": "JayR7/distilbert-base-cased/checkpoint-1000",
+  "epoch": 0.40080160320641284,
+  "eval_steps": 100,
+  "global_step": 1000,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.04,
+      "learning_rate": 1.959919839679359e-05,
+      "loss": 0.7657,
+      "step": 100
+    },
+    {
+      "epoch": 0.04,
+      "eval_accuracy": 0.891240629358438,
+      "eval_f1": 0.891240629358438,
+      "eval_loss": 0.2461320161819458,
+      "eval_precision": 0.891240629358438,
+      "eval_recall": 0.891240629358438,
+      "eval_runtime": 70.2088,
+      "eval_samples_per_second": 142.133,
+      "eval_steps_per_second": 8.888,
+      "step": 100
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 1.9198396793587175e-05,
+      "loss": 0.2295,
+      "step": 200
+    },
+    {
+      "epoch": 0.08,
+      "eval_accuracy": 0.9192844534518828,
+      "eval_f1": 0.9192844534518828,
+      "eval_loss": 0.17861397564411163,
+      "eval_precision": 0.9192844534518828,
+      "eval_recall": 0.9192844534518828,
+      "eval_runtime": 70.0566,
+      "eval_samples_per_second": 142.442,
+      "eval_steps_per_second": 8.907,
+      "step": 200
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 1.8797595190380762e-05,
+      "loss": 0.1704,
+      "step": 300
+    },
+    {
+      "epoch": 0.12,
+      "eval_accuracy": 0.9293279288702929,
+      "eval_f1": 0.9293279288702929,
+      "eval_loss": 0.1497383564710617,
+      "eval_precision": 0.9293279288702929,
+      "eval_recall": 0.9293279288702929,
+      "eval_runtime": 69.6477,
+      "eval_samples_per_second": 143.278,
+      "eval_steps_per_second": 8.959,
+      "step": 300
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 1.839679358717435e-05,
+      "loss": 0.1618,
+      "step": 400
+    },
+    {
+      "epoch": 0.16,
+      "eval_accuracy": 0.9359854428172942,
+      "eval_f1": 0.9359854428172942,
+      "eval_loss": 0.12991881370544434,
+      "eval_precision": 0.9359854428172942,
+      "eval_recall": 0.9359854428172942,
+      "eval_runtime": 70.1002,
+      "eval_samples_per_second": 142.353,
+      "eval_steps_per_second": 8.902,
+      "step": 400
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 1.7995991983967936e-05,
+      "loss": 0.1366,
+      "step": 500
+    },
+    {
+      "epoch": 0.2,
+      "eval_accuracy": 0.9360371992677824,
+      "eval_f1": 0.9360371992677824,
+      "eval_loss": 0.13222643733024597,
+      "eval_precision": 0.9360371992677824,
+      "eval_recall": 0.9360371992677824,
+      "eval_runtime": 69.7532,
+      "eval_samples_per_second": 143.062,
+      "eval_steps_per_second": 8.946,
+      "step": 500
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 1.7595190380761523e-05,
+      "loss": 0.1252,
+      "step": 600
+    },
+    {
+      "epoch": 0.24,
+      "eval_accuracy": 0.9404364975592747,
+      "eval_f1": 0.9404364975592747,
+      "eval_loss": 0.11517041176557541,
+      "eval_precision": 0.9404364975592747,
+      "eval_recall": 0.9404364975592747,
+      "eval_runtime": 69.595,
+      "eval_samples_per_second": 143.387,
+      "eval_steps_per_second": 8.966,
+      "step": 600
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 1.719438877755511e-05,
+      "loss": 0.1201,
+      "step": 700
+    },
+    {
+      "epoch": 0.28,
+      "eval_accuracy": 0.9426865411436541,
+      "eval_f1": 0.9426865411436541,
+      "eval_loss": 0.10682988166809082,
+      "eval_precision": 0.9426865411436541,
+      "eval_recall": 0.9426865411436541,
+      "eval_runtime": 70.4798,
+      "eval_samples_per_second": 141.587,
+      "eval_steps_per_second": 8.854,
+      "step": 700
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 1.6793587174348697e-05,
+      "loss": 0.1192,
+      "step": 800
+    },
+    {
+      "epoch": 0.32,
+      "eval_accuracy": 0.9439395920502092,
+      "eval_f1": 0.9439395920502092,
+      "eval_loss": 0.10515566915273666,
+      "eval_precision": 0.9439395920502092,
+      "eval_recall": 0.9439395920502092,
+      "eval_runtime": 69.7899,
+      "eval_samples_per_second": 142.986,
+      "eval_steps_per_second": 8.941,
+      "step": 800
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 1.6392785571142287e-05,
+      "loss": 0.1124,
+      "step": 900
+    },
+    {
+      "epoch": 0.36,
+      "eval_accuracy": 0.9446532862622036,
+      "eval_f1": 0.9446532862622036,
+      "eval_loss": 0.10284145176410675,
+      "eval_precision": 0.9446532862622036,
+      "eval_recall": 0.9446532862622036,
+      "eval_runtime": 69.8472,
+      "eval_samples_per_second": 142.869,
+      "eval_steps_per_second": 8.934,
+      "step": 900
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 1.5991983967935874e-05,
+      "loss": 0.109,
+      "step": 1000
+    },
+    {
+      "epoch": 0.4,
+      "eval_accuracy": 0.9458845449790795,
+      "eval_f1": 0.9458845449790795,
+      "eval_loss": 0.0995732992887497,
+      "eval_precision": 0.9458845449790795,
+      "eval_recall": 0.9458845449790795,
+      "eval_runtime": 69.7698,
+      "eval_samples_per_second": 143.028,
+      "eval_steps_per_second": 8.944,
+      "step": 1000
+    }
+  ],
+  "logging_steps": 100,
+  "max_steps": 4990,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 2,
+  "save_steps": 500,
+  "total_flos": 2090903175168000.0,
+  "train_batch_size": 16,
+  "trial_name": null,
+  "trial_params": null
+}

distilbert-base-cased/checkpoint-1000/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:da0d85271a02ae6175d7c1e0b4bc6de536afd6c48c218ee02c7929cf1116aefd
+size 4728

distilbert-base-cased/checkpoint-1000/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

distilbert-base-cased/checkpoint-1500/config.json ADDED Viewed

	@@ -0,0 +1,57 @@

+{
+  "_name_or_path": "distilbert-base-cased",
+  "activation": "gelu",
+  "architectures": [
+    "DistilBertForTokenClassification"
+  ],
+  "attention_dropout": 0.1,
+  "dim": 768,
+  "dropout": 0.1,
+  "hidden_dim": 3072,
+  "id2label": {
+    "0": "B-ProductNameEn",
+    "1": "I-ProductNameEn",
+    "2": "B-TradeMarkEn",
+    "3": "I-TradeMarkEn",
+    "4": "B-Country",
+    "5": "I-Country",
+    "6": "B-HSCode",
+    "7": "I-HSCode",
+    "8": "B-HSCodeEn",
+    "9": "I-HSCodeEn",
+    "10": "B-ManufacturerEn",
+    "11": "I-ManufacturerEn",
+    "12": "B-ModelNo",
+    "13": "I-ModelNo"
+  },
+  "initializer_range": 0.02,
+  "label2id": {
+    "B-Country": 4,
+    "B-HSCode": 6,
+    "B-HSCodeEn": 8,
+    "B-ManufacturerEn": 10,
+    "B-ModelNo": 12,
+    "B-ProductNameEn": 0,
+    "B-TradeMarkEn": 2,
+    "I-Country": 5,
+    "I-HSCode": 7,
+    "I-HSCodeEn": 9,
+    "I-ManufacturerEn": 11,
+    "I-ModelNo": 13,
+    "I-ProductNameEn": 1,
+    "I-TradeMarkEn": 3
+  },
+  "max_position_embeddings": 512,
+  "model_type": "distilbert",
+  "n_heads": 12,
+  "n_layers": 6,
+  "output_past": true,
+  "pad_token_id": 0,
+  "qa_dropout": 0.1,
+  "seq_classif_dropout": 0.2,
+  "sinusoidal_pos_embds": false,
+  "tie_weights_": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.37.2",
+  "vocab_size": 28996
+}

distilbert-base-cased/checkpoint-1500/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ab6b60caa294043f335c6676072fb224aaee94e4bea52026580c3c9448222bc7
+size 260819048

distilbert-base-cased/checkpoint-1500/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cf7751e30f60eb80951d566ee77f561d8d164ad636c263d6ccd00fdf4d0d8ac1
+size 521698874

distilbert-base-cased/checkpoint-1500/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0d8ce9c605147b35cecdd390c023be3c028ee93ee0b95b61dc0e17a30bc29ab4
+size 14244

distilbert-base-cased/checkpoint-1500/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:36743f70cac6ff710096a2cc9caa181a9f9b98bdececc0b13a72a9886a686fd1
+size 1064

distilbert-base-cased/checkpoint-1500/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

distilbert-base-cased/checkpoint-1500/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

distilbert-base-cased/checkpoint-1500/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": false,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "DistilBertTokenizer",
+  "unk_token": "[UNK]"
+}

distilbert-base-cased/checkpoint-1500/trainer_state.json ADDED Viewed

	@@ -0,0 +1,291 @@

+{
+  "best_metric": 0.09130043536424637,
+  "best_model_checkpoint": "JayR7/distilbert-base-cased/checkpoint-1500",
+  "epoch": 0.6012024048096193,
+  "eval_steps": 100,
+  "global_step": 1500,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.04,
+      "learning_rate": 1.959919839679359e-05,
+      "loss": 0.7657,
+      "step": 100
+    },
+    {
+      "epoch": 0.04,
+      "eval_accuracy": 0.891240629358438,
+      "eval_f1": 0.891240629358438,
+      "eval_loss": 0.2461320161819458,
+      "eval_precision": 0.891240629358438,
+      "eval_recall": 0.891240629358438,
+      "eval_runtime": 70.2088,
+      "eval_samples_per_second": 142.133,
+      "eval_steps_per_second": 8.888,
+      "step": 100
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 1.9198396793587175e-05,
+      "loss": 0.2295,
+      "step": 200
+    },
+    {
+      "epoch": 0.08,
+      "eval_accuracy": 0.9192844534518828,
+      "eval_f1": 0.9192844534518828,
+      "eval_loss": 0.17861397564411163,
+      "eval_precision": 0.9192844534518828,
+      "eval_recall": 0.9192844534518828,
+      "eval_runtime": 70.0566,
+      "eval_samples_per_second": 142.442,
+      "eval_steps_per_second": 8.907,
+      "step": 200
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 1.8797595190380762e-05,
+      "loss": 0.1704,
+      "step": 300
+    },
+    {
+      "epoch": 0.12,
+      "eval_accuracy": 0.9293279288702929,
+      "eval_f1": 0.9293279288702929,
+      "eval_loss": 0.1497383564710617,
+      "eval_precision": 0.9293279288702929,
+      "eval_recall": 0.9293279288702929,
+      "eval_runtime": 69.6477,
+      "eval_samples_per_second": 143.278,
+      "eval_steps_per_second": 8.959,
+      "step": 300
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 1.839679358717435e-05,
+      "loss": 0.1618,
+      "step": 400
+    },
+    {
+      "epoch": 0.16,
+      "eval_accuracy": 0.9359854428172942,
+      "eval_f1": 0.9359854428172942,
+      "eval_loss": 0.12991881370544434,
+      "eval_precision": 0.9359854428172942,
+      "eval_recall": 0.9359854428172942,
+      "eval_runtime": 70.1002,
+      "eval_samples_per_second": 142.353,
+      "eval_steps_per_second": 8.902,
+      "step": 400
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 1.7995991983967936e-05,
+      "loss": 0.1366,
+      "step": 500
+    },
+    {
+      "epoch": 0.2,
+      "eval_accuracy": 0.9360371992677824,
+      "eval_f1": 0.9360371992677824,
+      "eval_loss": 0.13222643733024597,
+      "eval_precision": 0.9360371992677824,
+      "eval_recall": 0.9360371992677824,
+      "eval_runtime": 69.7532,
+      "eval_samples_per_second": 143.062,
+      "eval_steps_per_second": 8.946,
+      "step": 500
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 1.7595190380761523e-05,
+      "loss": 0.1252,
+      "step": 600
+    },
+    {
+      "epoch": 0.24,
+      "eval_accuracy": 0.9404364975592747,
+      "eval_f1": 0.9404364975592747,
+      "eval_loss": 0.11517041176557541,
+      "eval_precision": 0.9404364975592747,
+      "eval_recall": 0.9404364975592747,
+      "eval_runtime": 69.595,
+      "eval_samples_per_second": 143.387,
+      "eval_steps_per_second": 8.966,
+      "step": 600
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 1.719438877755511e-05,
+      "loss": 0.1201,
+      "step": 700
+    },
+    {
+      "epoch": 0.28,
+      "eval_accuracy": 0.9426865411436541,
+      "eval_f1": 0.9426865411436541,
+      "eval_loss": 0.10682988166809082,
+      "eval_precision": 0.9426865411436541,
+      "eval_recall": 0.9426865411436541,
+      "eval_runtime": 70.4798,
+      "eval_samples_per_second": 141.587,
+      "eval_steps_per_second": 8.854,
+      "step": 700
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 1.6793587174348697e-05,
+      "loss": 0.1192,
+      "step": 800
+    },
+    {
+      "epoch": 0.32,
+      "eval_accuracy": 0.9439395920502092,
+      "eval_f1": 0.9439395920502092,
+      "eval_loss": 0.10515566915273666,
+      "eval_precision": 0.9439395920502092,
+      "eval_recall": 0.9439395920502092,
+      "eval_runtime": 69.7899,
+      "eval_samples_per_second": 142.986,
+      "eval_steps_per_second": 8.941,
+      "step": 800
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 1.6392785571142287e-05,
+      "loss": 0.1124,
+      "step": 900
+    },
+    {
+      "epoch": 0.36,
+      "eval_accuracy": 0.9446532862622036,
+      "eval_f1": 0.9446532862622036,
+      "eval_loss": 0.10284145176410675,
+      "eval_precision": 0.9446532862622036,
+      "eval_recall": 0.9446532862622036,
+      "eval_runtime": 69.8472,
+      "eval_samples_per_second": 142.869,
+      "eval_steps_per_second": 8.934,
+      "step": 900
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 1.5991983967935874e-05,
+      "loss": 0.109,
+      "step": 1000
+    },
+    {
+      "epoch": 0.4,
+      "eval_accuracy": 0.9458845449790795,
+      "eval_f1": 0.9458845449790795,
+      "eval_loss": 0.0995732992887497,
+      "eval_precision": 0.9458845449790795,
+      "eval_recall": 0.9458845449790795,
+      "eval_runtime": 69.7698,
+      "eval_samples_per_second": 143.028,
+      "eval_steps_per_second": 8.944,
+      "step": 1000
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 1.559118236472946e-05,
+      "loss": 0.1026,
+      "step": 1100
+    },
+    {
+      "epoch": 0.44,
+      "eval_accuracy": 0.946009850069735,
+      "eval_f1": 0.946009850069735,
+      "eval_loss": 0.09745196253061295,
+      "eval_precision": 0.946009850069735,
+      "eval_recall": 0.946009850069735,
+      "eval_runtime": 70.3509,
+      "eval_samples_per_second": 141.846,
+      "eval_steps_per_second": 8.87,
+      "step": 1100
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 1.5190380761523047e-05,
+      "loss": 0.0984,
+      "step": 1200
+    },
+    {
+      "epoch": 0.48,
+      "eval_accuracy": 0.9475189592050209,
+      "eval_f1": 0.9475189592050209,
+      "eval_loss": 0.09556742012500763,
+      "eval_precision": 0.9475189592050209,
+      "eval_recall": 0.9475189592050209,
+      "eval_runtime": 70.7974,
+      "eval_samples_per_second": 140.951,
+      "eval_steps_per_second": 8.814,
+      "step": 1200
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 1.4789579158316633e-05,
+      "loss": 0.1014,
+      "step": 1300
+    },
+    {
+      "epoch": 0.52,
+      "eval_accuracy": 0.9479520789748954,
+      "eval_f1": 0.9479520789748954,
+      "eval_loss": 0.09433256834745407,
+      "eval_precision": 0.9479520789748954,
+      "eval_recall": 0.9479520789748954,
+      "eval_runtime": 69.9794,
+      "eval_samples_per_second": 142.599,
+      "eval_steps_per_second": 8.917,
+      "step": 1300
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 1.4388777555110222e-05,
+      "loss": 0.1085,
+      "step": 1400
+    },
+    {
+      "epoch": 0.56,
+      "eval_accuracy": 0.9476878486750349,
+      "eval_f1": 0.9476878486750349,
+      "eval_loss": 0.0909435972571373,
+      "eval_precision": 0.9476878486750349,
+      "eval_recall": 0.9476878486750349,
+      "eval_runtime": 70.3051,
+      "eval_samples_per_second": 141.939,
+      "eval_steps_per_second": 8.876,
+      "step": 1400
+    },
+    {
+      "epoch": 0.6,
+      "learning_rate": 1.3987975951903809e-05,
+      "loss": 0.0965,
+      "step": 1500
+    },
+    {
+      "epoch": 0.6,
+      "eval_accuracy": 0.9481454846582985,
+      "eval_f1": 0.9481454846582985,
+      "eval_loss": 0.09130043536424637,
+      "eval_precision": 0.9481454846582985,
+      "eval_recall": 0.9481454846582985,
+      "eval_runtime": 70.3437,
+      "eval_samples_per_second": 141.861,
+      "eval_steps_per_second": 8.871,
+      "step": 1500
+    }
+  ],
+  "logging_steps": 100,
+  "max_steps": 4990,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 2,
+  "save_steps": 500,
+  "total_flos": 3136354762752000.0,
+  "train_batch_size": 16,
+  "trial_name": null,
+  "trial_params": null
+}

distilbert-base-cased/checkpoint-1500/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:da0d85271a02ae6175d7c1e0b4bc6de536afd6c48c218ee02c7929cf1116aefd
+size 4728

distilbert-base-cased/checkpoint-1500/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

distilbert-base-cased/checkpoint-2000/config.json ADDED Viewed

	@@ -0,0 +1,57 @@

+{
+  "_name_or_path": "distilbert-base-cased",
+  "activation": "gelu",
+  "architectures": [
+    "DistilBertForTokenClassification"
+  ],
+  "attention_dropout": 0.1,
+  "dim": 768,
+  "dropout": 0.1,
+  "hidden_dim": 3072,
+  "id2label": {
+    "0": "B-ProductNameEn",
+    "1": "I-ProductNameEn",
+    "2": "B-TradeMarkEn",
+    "3": "I-TradeMarkEn",
+    "4": "B-Country",
+    "5": "I-Country",
+    "6": "B-HSCode",
+    "7": "I-HSCode",
+    "8": "B-HSCodeEn",
+    "9": "I-HSCodeEn",
+    "10": "B-ManufacturerEn",
+    "11": "I-ManufacturerEn",
+    "12": "B-ModelNo",
+    "13": "I-ModelNo"
+  },
+  "initializer_range": 0.02,
+  "label2id": {
+    "B-Country": 4,
+    "B-HSCode": 6,
+    "B-HSCodeEn": 8,
+    "B-ManufacturerEn": 10,
+    "B-ModelNo": 12,
+    "B-ProductNameEn": 0,
+    "B-TradeMarkEn": 2,
+    "I-Country": 5,
+    "I-HSCode": 7,
+    "I-HSCodeEn": 9,
+    "I-ManufacturerEn": 11,
+    "I-ModelNo": 13,
+    "I-ProductNameEn": 1,
+    "I-TradeMarkEn": 3
+  },
+  "max_position_embeddings": 512,
+  "model_type": "distilbert",
+  "n_heads": 12,
+  "n_layers": 6,
+  "output_past": true,
+  "pad_token_id": 0,
+  "qa_dropout": 0.1,
+  "seq_classif_dropout": 0.2,
+  "sinusoidal_pos_embds": false,
+  "tie_weights_": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.37.2",
+  "vocab_size": 28996
+}

distilbert-base-cased/checkpoint-2000/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fb1d0e486f282b7b882540956eaf17cb71ce9934d2f49b0693c033b4d492f20e
+size 260819048

distilbert-base-cased/checkpoint-2000/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cef26972582a00dfe2ca3ec2807b32f1300a86441592251f00354b776d92c83c
+size 521698874

distilbert-base-cased/checkpoint-2000/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2c1b4f86230697a32c1a7490e542f2f67b5a4a1f21d67b1ae0d148402158d8a9
+size 14244

distilbert-base-cased/checkpoint-2000/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:701e37da4aab50072e3b78d31cf7207a36ae829c3754a5d40cf3adffe1cc8713
+size 1064

distilbert-base-cased/checkpoint-2000/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

distilbert-base-cased/checkpoint-2000/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

distilbert-base-cased/checkpoint-2000/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": false,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "DistilBertTokenizer",
+  "unk_token": "[UNK]"
+}

distilbert-base-cased/checkpoint-2000/trainer_state.json ADDED Viewed

	@@ -0,0 +1,381 @@

+{
+  "best_metric": 0.08437436819076538,
+  "best_model_checkpoint": "JayR7/distilbert-base-cased/checkpoint-2000",
+  "epoch": 0.8016032064128257,
+  "eval_steps": 100,
+  "global_step": 2000,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.04,
+      "learning_rate": 1.959919839679359e-05,
+      "loss": 0.7657,
+      "step": 100
+    },
+    {
+      "epoch": 0.04,
+      "eval_accuracy": 0.891240629358438,
+      "eval_f1": 0.891240629358438,
+      "eval_loss": 0.2461320161819458,
+      "eval_precision": 0.891240629358438,
+      "eval_recall": 0.891240629358438,
+      "eval_runtime": 70.2088,
+      "eval_samples_per_second": 142.133,
+      "eval_steps_per_second": 8.888,
+      "step": 100
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 1.9198396793587175e-05,
+      "loss": 0.2295,
+      "step": 200
+    },
+    {
+      "epoch": 0.08,
+      "eval_accuracy": 0.9192844534518828,
+      "eval_f1": 0.9192844534518828,
+      "eval_loss": 0.17861397564411163,
+      "eval_precision": 0.9192844534518828,
+      "eval_recall": 0.9192844534518828,
+      "eval_runtime": 70.0566,
+      "eval_samples_per_second": 142.442,
+      "eval_steps_per_second": 8.907,
+      "step": 200
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 1.8797595190380762e-05,
+      "loss": 0.1704,
+      "step": 300
+    },
+    {
+      "epoch": 0.12,
+      "eval_accuracy": 0.9293279288702929,
+      "eval_f1": 0.9293279288702929,
+      "eval_loss": 0.1497383564710617,
+      "eval_precision": 0.9293279288702929,
+      "eval_recall": 0.9293279288702929,
+      "eval_runtime": 69.6477,
+      "eval_samples_per_second": 143.278,
+      "eval_steps_per_second": 8.959,
+      "step": 300
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 1.839679358717435e-05,
+      "loss": 0.1618,
+      "step": 400
+    },
+    {
+      "epoch": 0.16,
+      "eval_accuracy": 0.9359854428172942,
+      "eval_f1": 0.9359854428172942,
+      "eval_loss": 0.12991881370544434,
+      "eval_precision": 0.9359854428172942,
+      "eval_recall": 0.9359854428172942,
+      "eval_runtime": 70.1002,
+      "eval_samples_per_second": 142.353,
+      "eval_steps_per_second": 8.902,
+      "step": 400
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 1.7995991983967936e-05,
+      "loss": 0.1366,
+      "step": 500
+    },
+    {
+      "epoch": 0.2,
+      "eval_accuracy": 0.9360371992677824,
+      "eval_f1": 0.9360371992677824,
+      "eval_loss": 0.13222643733024597,
+      "eval_precision": 0.9360371992677824,
+      "eval_recall": 0.9360371992677824,
+      "eval_runtime": 69.7532,
+      "eval_samples_per_second": 143.062,
+      "eval_steps_per_second": 8.946,
+      "step": 500
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 1.7595190380761523e-05,
+      "loss": 0.1252,
+      "step": 600
+    },
+    {
+      "epoch": 0.24,
+      "eval_accuracy": 0.9404364975592747,
+      "eval_f1": 0.9404364975592747,
+      "eval_loss": 0.11517041176557541,
+      "eval_precision": 0.9404364975592747,
+      "eval_recall": 0.9404364975592747,
+      "eval_runtime": 69.595,
+      "eval_samples_per_second": 143.387,
+      "eval_steps_per_second": 8.966,
+      "step": 600
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 1.719438877755511e-05,
+      "loss": 0.1201,
+      "step": 700
+    },
+    {
+      "epoch": 0.28,
+      "eval_accuracy": 0.9426865411436541,
+      "eval_f1": 0.9426865411436541,
+      "eval_loss": 0.10682988166809082,
+      "eval_precision": 0.9426865411436541,
+      "eval_recall": 0.9426865411436541,
+      "eval_runtime": 70.4798,
+      "eval_samples_per_second": 141.587,
+      "eval_steps_per_second": 8.854,
+      "step": 700
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 1.6793587174348697e-05,
+      "loss": 0.1192,
+      "step": 800
+    },
+    {
+      "epoch": 0.32,
+      "eval_accuracy": 0.9439395920502092,
+      "eval_f1": 0.9439395920502092,
+      "eval_loss": 0.10515566915273666,
+      "eval_precision": 0.9439395920502092,
+      "eval_recall": 0.9439395920502092,
+      "eval_runtime": 69.7899,
+      "eval_samples_per_second": 142.986,
+      "eval_steps_per_second": 8.941,
+      "step": 800
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 1.6392785571142287e-05,
+      "loss": 0.1124,
+      "step": 900
+    },
+    {
+      "epoch": 0.36,
+      "eval_accuracy": 0.9446532862622036,
+      "eval_f1": 0.9446532862622036,
+      "eval_loss": 0.10284145176410675,
+      "eval_precision": 0.9446532862622036,
+      "eval_recall": 0.9446532862622036,
+      "eval_runtime": 69.8472,
+      "eval_samples_per_second": 142.869,
+      "eval_steps_per_second": 8.934,
+      "step": 900
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 1.5991983967935874e-05,
+      "loss": 0.109,
+      "step": 1000
+    },
+    {
+      "epoch": 0.4,
+      "eval_accuracy": 0.9458845449790795,
+      "eval_f1": 0.9458845449790795,
+      "eval_loss": 0.0995732992887497,
+      "eval_precision": 0.9458845449790795,
+      "eval_recall": 0.9458845449790795,
+      "eval_runtime": 69.7698,
+      "eval_samples_per_second": 143.028,
+      "eval_steps_per_second": 8.944,
+      "step": 1000
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 1.559118236472946e-05,
+      "loss": 0.1026,
+      "step": 1100
+    },
+    {
+      "epoch": 0.44,
+      "eval_accuracy": 0.946009850069735,
+      "eval_f1": 0.946009850069735,
+      "eval_loss": 0.09745196253061295,
+      "eval_precision": 0.946009850069735,
+      "eval_recall": 0.946009850069735,
+      "eval_runtime": 70.3509,
+      "eval_samples_per_second": 141.846,
+      "eval_steps_per_second": 8.87,
+      "step": 1100
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 1.5190380761523047e-05,
+      "loss": 0.0984,
+      "step": 1200
+    },
+    {
+      "epoch": 0.48,
+      "eval_accuracy": 0.9475189592050209,
+      "eval_f1": 0.9475189592050209,
+      "eval_loss": 0.09556742012500763,
+      "eval_precision": 0.9475189592050209,
+      "eval_recall": 0.9475189592050209,
+      "eval_runtime": 70.7974,
+      "eval_samples_per_second": 140.951,
+      "eval_steps_per_second": 8.814,
+      "step": 1200
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 1.4789579158316633e-05,
+      "loss": 0.1014,
+      "step": 1300
+    },
+    {
+      "epoch": 0.52,
+      "eval_accuracy": 0.9479520789748954,
+      "eval_f1": 0.9479520789748954,
+      "eval_loss": 0.09433256834745407,
+      "eval_precision": 0.9479520789748954,
+      "eval_recall": 0.9479520789748954,
+      "eval_runtime": 69.9794,
+      "eval_samples_per_second": 142.599,
+      "eval_steps_per_second": 8.917,
+      "step": 1300
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 1.4388777555110222e-05,
+      "loss": 0.1085,
+      "step": 1400
+    },
+    {
+      "epoch": 0.56,
+      "eval_accuracy": 0.9476878486750349,
+      "eval_f1": 0.9476878486750349,
+      "eval_loss": 0.0909435972571373,
+      "eval_precision": 0.9476878486750349,
+      "eval_recall": 0.9476878486750349,
+      "eval_runtime": 70.3051,
+      "eval_samples_per_second": 141.939,
+      "eval_steps_per_second": 8.876,
+      "step": 1400
+    },
+    {
+      "epoch": 0.6,
+      "learning_rate": 1.3987975951903809e-05,
+      "loss": 0.0965,
+      "step": 1500
+    },
+    {
+      "epoch": 0.6,
+      "eval_accuracy": 0.9481454846582985,
+      "eval_f1": 0.9481454846582985,
+      "eval_loss": 0.09130043536424637,
+      "eval_precision": 0.9481454846582985,
+      "eval_recall": 0.9481454846582985,
+      "eval_runtime": 70.3437,
+      "eval_samples_per_second": 141.861,
+      "eval_steps_per_second": 8.871,
+      "step": 1500
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 1.3587174348697396e-05,
+      "loss": 0.0932,
+      "step": 1600
+    },
+    {
+      "epoch": 0.64,
+      "eval_accuracy": 0.948521399930265,
+      "eval_f1": 0.948521399930265,
+      "eval_loss": 0.08914197236299515,
+      "eval_precision": 0.948521399930265,
+      "eval_recall": 0.948521399930265,
+      "eval_runtime": 70.1844,
+      "eval_samples_per_second": 142.183,
+      "eval_steps_per_second": 8.891,
+      "step": 1600
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 1.3186372745490983e-05,
+      "loss": 0.0948,
+      "step": 1700
+    },
+    {
+      "epoch": 0.68,
+      "eval_accuracy": 0.9489163833682008,
+      "eval_f1": 0.9489163833682008,
+      "eval_loss": 0.08800023049116135,
+      "eval_precision": 0.9489163833682008,
+      "eval_recall": 0.9489163833682008,
+      "eval_runtime": 70.4997,
+      "eval_samples_per_second": 141.547,
+      "eval_steps_per_second": 8.851,
+      "step": 1700
+    },
+    {
+      "epoch": 0.72,
+      "learning_rate": 1.278557114228457e-05,
+      "loss": 0.0922,
+      "step": 1800
+    },
+    {
+      "epoch": 0.72,
+      "eval_accuracy": 0.9492814025453278,
+      "eval_f1": 0.9492814025453278,
+      "eval_loss": 0.08633574843406677,
+      "eval_precision": 0.9492814025453278,
+      "eval_recall": 0.9492814025453278,
+      "eval_runtime": 70.4874,
+      "eval_samples_per_second": 141.571,
+      "eval_steps_per_second": 8.853,
+      "step": 1800
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 1.2384769539078157e-05,
+      "loss": 0.0889,
+      "step": 1900
+    },
+    {
+      "epoch": 0.76,
+      "eval_accuracy": 0.9499106520223152,
+      "eval_f1": 0.9499106520223152,
+      "eval_loss": 0.08566854894161224,
+      "eval_precision": 0.9499106520223152,
+      "eval_recall": 0.9499106520223152,
+      "eval_runtime": 70.5777,
+      "eval_samples_per_second": 141.39,
+      "eval_steps_per_second": 8.841,
+      "step": 1900
+    },
+    {
+      "epoch": 0.8,
+      "learning_rate": 1.1983967935871745e-05,
+      "loss": 0.0864,
+      "step": 2000
+    },
+    {
+      "epoch": 0.8,
+      "eval_accuracy": 0.9501558141562064,
+      "eval_f1": 0.9501558141562064,
+      "eval_loss": 0.08437436819076538,
+      "eval_precision": 0.9501558141562064,
+      "eval_recall": 0.9501558141562064,
+      "eval_runtime": 70.1921,
+      "eval_samples_per_second": 142.167,
+      "eval_steps_per_second": 8.89,
+      "step": 2000
+    }
+  ],
+  "logging_steps": 100,
+  "max_steps": 4990,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 2,
+  "save_steps": 500,
+  "total_flos": 4181806350336000.0,
+  "train_batch_size": 16,
+  "trial_name": null,
+  "trial_params": null
+}

distilbert-base-cased/checkpoint-2000/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:da0d85271a02ae6175d7c1e0b4bc6de536afd6c48c218ee02c7929cf1116aefd
+size 4728

distilbert-base-cased/checkpoint-2000/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

distilbert-base-cased/checkpoint-2500/config.json ADDED Viewed

	@@ -0,0 +1,57 @@

+{
+  "_name_or_path": "distilbert-base-cased",
+  "activation": "gelu",
+  "architectures": [
+    "DistilBertForTokenClassification"
+  ],
+  "attention_dropout": 0.1,
+  "dim": 768,
+  "dropout": 0.1,
+  "hidden_dim": 3072,
+  "id2label": {
+    "0": "B-ProductNameEn",
+    "1": "I-ProductNameEn",
+    "2": "B-TradeMarkEn",
+    "3": "I-TradeMarkEn",
+    "4": "B-Country",
+    "5": "I-Country",
+    "6": "B-HSCode",
+    "7": "I-HSCode",
+    "8": "B-HSCodeEn",
+    "9": "I-HSCodeEn",
+    "10": "B-ManufacturerEn",
+    "11": "I-ManufacturerEn",
+    "12": "B-ModelNo",
+    "13": "I-ModelNo"
+  },
+  "initializer_range": 0.02,
+  "label2id": {
+    "B-Country": 4,
+    "B-HSCode": 6,
+    "B-HSCodeEn": 8,
+    "B-ManufacturerEn": 10,
+    "B-ModelNo": 12,
+    "B-ProductNameEn": 0,
+    "B-TradeMarkEn": 2,
+    "I-Country": 5,
+    "I-HSCode": 7,
+    "I-HSCodeEn": 9,
+    "I-ManufacturerEn": 11,
+    "I-ModelNo": 13,
+    "I-ProductNameEn": 1,
+    "I-TradeMarkEn": 3
+  },
+  "max_position_embeddings": 512,
+  "model_type": "distilbert",
+  "n_heads": 12,
+  "n_layers": 6,
+  "output_past": true,
+  "pad_token_id": 0,
+  "qa_dropout": 0.1,
+  "seq_classif_dropout": 0.2,
+  "sinusoidal_pos_embds": false,
+  "tie_weights_": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.37.2",
+  "vocab_size": 28996
+}

distilbert-base-cased/checkpoint-2500/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bf578dd14247b7f6e066dd1dd1afd7f2865087668233d3007d095926f203fe83
+size 260819048

distilbert-base-cased/checkpoint-2500/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:be9f0d39c84adc96212fc18c7068eaa2b0086ba8f55d4ba58f5cf98eee28ac04
+size 521698874

distilbert-base-cased/checkpoint-2500/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:82ba329afed7cc48d5d95b8d6fd8c61cbd6f211c85874cf3035e095a6ed44041
+size 14244

distilbert-base-cased/checkpoint-2500/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f892d31cbfc307076f6d29d3fc084241cbfad373ec3833bbcf5185f53ee5763c
+size 1064

distilbert-base-cased/checkpoint-2500/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

distilbert-base-cased/checkpoint-2500/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

distilbert-base-cased/checkpoint-2500/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "100": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "101": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "102": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "103": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_lower_case": false,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "DistilBertTokenizer",
+  "unk_token": "[UNK]"
+}

distilbert-base-cased/checkpoint-2500/trainer_state.json ADDED Viewed

	@@ -0,0 +1,471 @@

+{
+  "best_metric": 0.08178979158401489,
+  "best_model_checkpoint": "JayR7/distilbert-base-cased/checkpoint-2500",
+  "epoch": 1.002004008016032,
+  "eval_steps": 100,
+  "global_step": 2500,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.04,
+      "learning_rate": 1.959919839679359e-05,
+      "loss": 0.7657,
+      "step": 100
+    },
+    {
+      "epoch": 0.04,
+      "eval_accuracy": 0.891240629358438,
+      "eval_f1": 0.891240629358438,
+      "eval_loss": 0.2461320161819458,
+      "eval_precision": 0.891240629358438,
+      "eval_recall": 0.891240629358438,
+      "eval_runtime": 70.2088,
+      "eval_samples_per_second": 142.133,
+      "eval_steps_per_second": 8.888,
+      "step": 100
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 1.9198396793587175e-05,
+      "loss": 0.2295,
+      "step": 200
+    },
+    {
+      "epoch": 0.08,
+      "eval_accuracy": 0.9192844534518828,
+      "eval_f1": 0.9192844534518828,
+      "eval_loss": 0.17861397564411163,
+      "eval_precision": 0.9192844534518828,
+      "eval_recall": 0.9192844534518828,
+      "eval_runtime": 70.0566,
+      "eval_samples_per_second": 142.442,
+      "eval_steps_per_second": 8.907,
+      "step": 200
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 1.8797595190380762e-05,
+      "loss": 0.1704,
+      "step": 300
+    },
+    {
+      "epoch": 0.12,
+      "eval_accuracy": 0.9293279288702929,
+      "eval_f1": 0.9293279288702929,
+      "eval_loss": 0.1497383564710617,
+      "eval_precision": 0.9293279288702929,
+      "eval_recall": 0.9293279288702929,
+      "eval_runtime": 69.6477,
+      "eval_samples_per_second": 143.278,
+      "eval_steps_per_second": 8.959,
+      "step": 300
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 1.839679358717435e-05,
+      "loss": 0.1618,
+      "step": 400
+    },
+    {
+      "epoch": 0.16,
+      "eval_accuracy": 0.9359854428172942,
+      "eval_f1": 0.9359854428172942,
+      "eval_loss": 0.12991881370544434,
+      "eval_precision": 0.9359854428172942,
+      "eval_recall": 0.9359854428172942,
+      "eval_runtime": 70.1002,
+      "eval_samples_per_second": 142.353,
+      "eval_steps_per_second": 8.902,
+      "step": 400
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 1.7995991983967936e-05,
+      "loss": 0.1366,
+      "step": 500
+    },
+    {
+      "epoch": 0.2,
+      "eval_accuracy": 0.9360371992677824,
+      "eval_f1": 0.9360371992677824,
+      "eval_loss": 0.13222643733024597,
+      "eval_precision": 0.9360371992677824,
+      "eval_recall": 0.9360371992677824,
+      "eval_runtime": 69.7532,
+      "eval_samples_per_second": 143.062,
+      "eval_steps_per_second": 8.946,
+      "step": 500
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 1.7595190380761523e-05,
+      "loss": 0.1252,
+      "step": 600
+    },
+    {
+      "epoch": 0.24,
+      "eval_accuracy": 0.9404364975592747,
+      "eval_f1": 0.9404364975592747,
+      "eval_loss": 0.11517041176557541,
+      "eval_precision": 0.9404364975592747,
+      "eval_recall": 0.9404364975592747,
+      "eval_runtime": 69.595,
+      "eval_samples_per_second": 143.387,
+      "eval_steps_per_second": 8.966,
+      "step": 600
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 1.719438877755511e-05,
+      "loss": 0.1201,
+      "step": 700
+    },
+    {
+      "epoch": 0.28,
+      "eval_accuracy": 0.9426865411436541,
+      "eval_f1": 0.9426865411436541,
+      "eval_loss": 0.10682988166809082,
+      "eval_precision": 0.9426865411436541,
+      "eval_recall": 0.9426865411436541,
+      "eval_runtime": 70.4798,
+      "eval_samples_per_second": 141.587,
+      "eval_steps_per_second": 8.854,
+      "step": 700
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 1.6793587174348697e-05,
+      "loss": 0.1192,
+      "step": 800
+    },
+    {
+      "epoch": 0.32,
+      "eval_accuracy": 0.9439395920502092,
+      "eval_f1": 0.9439395920502092,
+      "eval_loss": 0.10515566915273666,
+      "eval_precision": 0.9439395920502092,
+      "eval_recall": 0.9439395920502092,
+      "eval_runtime": 69.7899,
+      "eval_samples_per_second": 142.986,
+      "eval_steps_per_second": 8.941,
+      "step": 800
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 1.6392785571142287e-05,
+      "loss": 0.1124,
+      "step": 900
+    },
+    {
+      "epoch": 0.36,
+      "eval_accuracy": 0.9446532862622036,
+      "eval_f1": 0.9446532862622036,
+      "eval_loss": 0.10284145176410675,
+      "eval_precision": 0.9446532862622036,
+      "eval_recall": 0.9446532862622036,
+      "eval_runtime": 69.8472,
+      "eval_samples_per_second": 142.869,
+      "eval_steps_per_second": 8.934,
+      "step": 900
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 1.5991983967935874e-05,
+      "loss": 0.109,
+      "step": 1000
+    },
+    {
+      "epoch": 0.4,
+      "eval_accuracy": 0.9458845449790795,
+      "eval_f1": 0.9458845449790795,
+      "eval_loss": 0.0995732992887497,
+      "eval_precision": 0.9458845449790795,
+      "eval_recall": 0.9458845449790795,
+      "eval_runtime": 69.7698,
+      "eval_samples_per_second": 143.028,
+      "eval_steps_per_second": 8.944,
+      "step": 1000
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 1.559118236472946e-05,
+      "loss": 0.1026,
+      "step": 1100
+    },
+    {
+      "epoch": 0.44,
+      "eval_accuracy": 0.946009850069735,
+      "eval_f1": 0.946009850069735,
+      "eval_loss": 0.09745196253061295,
+      "eval_precision": 0.946009850069735,
+      "eval_recall": 0.946009850069735,
+      "eval_runtime": 70.3509,
+      "eval_samples_per_second": 141.846,
+      "eval_steps_per_second": 8.87,
+      "step": 1100
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 1.5190380761523047e-05,
+      "loss": 0.0984,
+      "step": 1200
+    },
+    {
+      "epoch": 0.48,
+      "eval_accuracy": 0.9475189592050209,
+      "eval_f1": 0.9475189592050209,
+      "eval_loss": 0.09556742012500763,
+      "eval_precision": 0.9475189592050209,
+      "eval_recall": 0.9475189592050209,
+      "eval_runtime": 70.7974,
+      "eval_samples_per_second": 140.951,
+      "eval_steps_per_second": 8.814,
+      "step": 1200
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 1.4789579158316633e-05,
+      "loss": 0.1014,
+      "step": 1300
+    },
+    {
+      "epoch": 0.52,
+      "eval_accuracy": 0.9479520789748954,
+      "eval_f1": 0.9479520789748954,
+      "eval_loss": 0.09433256834745407,
+      "eval_precision": 0.9479520789748954,
+      "eval_recall": 0.9479520789748954,
+      "eval_runtime": 69.9794,
+      "eval_samples_per_second": 142.599,
+      "eval_steps_per_second": 8.917,
+      "step": 1300
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 1.4388777555110222e-05,
+      "loss": 0.1085,
+      "step": 1400
+    },
+    {
+      "epoch": 0.56,
+      "eval_accuracy": 0.9476878486750349,
+      "eval_f1": 0.9476878486750349,
+      "eval_loss": 0.0909435972571373,
+      "eval_precision": 0.9476878486750349,
+      "eval_recall": 0.9476878486750349,
+      "eval_runtime": 70.3051,
+      "eval_samples_per_second": 141.939,
+      "eval_steps_per_second": 8.876,
+      "step": 1400
+    },
+    {
+      "epoch": 0.6,
+      "learning_rate": 1.3987975951903809e-05,
+      "loss": 0.0965,
+      "step": 1500
+    },
+    {
+      "epoch": 0.6,
+      "eval_accuracy": 0.9481454846582985,
+      "eval_f1": 0.9481454846582985,
+      "eval_loss": 0.09130043536424637,
+      "eval_precision": 0.9481454846582985,
+      "eval_recall": 0.9481454846582985,
+      "eval_runtime": 70.3437,
+      "eval_samples_per_second": 141.861,
+      "eval_steps_per_second": 8.871,
+      "step": 1500
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 1.3587174348697396e-05,
+      "loss": 0.0932,
+      "step": 1600
+    },
+    {
+      "epoch": 0.64,
+      "eval_accuracy": 0.948521399930265,
+      "eval_f1": 0.948521399930265,
+      "eval_loss": 0.08914197236299515,
+      "eval_precision": 0.948521399930265,
+      "eval_recall": 0.948521399930265,
+      "eval_runtime": 70.1844,
+      "eval_samples_per_second": 142.183,
+      "eval_steps_per_second": 8.891,
+      "step": 1600
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 1.3186372745490983e-05,
+      "loss": 0.0948,
+      "step": 1700
+    },
+    {
+      "epoch": 0.68,
+      "eval_accuracy": 0.9489163833682008,
+      "eval_f1": 0.9489163833682008,
+      "eval_loss": 0.08800023049116135,
+      "eval_precision": 0.9489163833682008,
+      "eval_recall": 0.9489163833682008,
+      "eval_runtime": 70.4997,
+      "eval_samples_per_second": 141.547,
+      "eval_steps_per_second": 8.851,
+      "step": 1700
+    },
+    {
+      "epoch": 0.72,
+      "learning_rate": 1.278557114228457e-05,
+      "loss": 0.0922,
+      "step": 1800
+    },
+    {
+      "epoch": 0.72,
+      "eval_accuracy": 0.9492814025453278,
+      "eval_f1": 0.9492814025453278,
+      "eval_loss": 0.08633574843406677,
+      "eval_precision": 0.9492814025453278,
+      "eval_recall": 0.9492814025453278,
+      "eval_runtime": 70.4874,
+      "eval_samples_per_second": 141.571,
+      "eval_steps_per_second": 8.853,
+      "step": 1800
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 1.2384769539078157e-05,
+      "loss": 0.0889,
+      "step": 1900
+    },
+    {
+      "epoch": 0.76,
+      "eval_accuracy": 0.9499106520223152,
+      "eval_f1": 0.9499106520223152,
+      "eval_loss": 0.08566854894161224,
+      "eval_precision": 0.9499106520223152,
+      "eval_recall": 0.9499106520223152,
+      "eval_runtime": 70.5777,
+      "eval_samples_per_second": 141.39,
+      "eval_steps_per_second": 8.841,
+      "step": 1900
+    },
+    {
+      "epoch": 0.8,
+      "learning_rate": 1.1983967935871745e-05,
+      "loss": 0.0864,
+      "step": 2000
+    },
+    {
+      "epoch": 0.8,
+      "eval_accuracy": 0.9501558141562064,
+      "eval_f1": 0.9501558141562064,
+      "eval_loss": 0.08437436819076538,
+      "eval_precision": 0.9501558141562064,
+      "eval_recall": 0.9501558141562064,
+      "eval_runtime": 70.1921,
+      "eval_samples_per_second": 142.167,
+      "eval_steps_per_second": 8.89,
+      "step": 2000
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 1.1583166332665332e-05,
+      "loss": 0.0941,
+      "step": 2100
+    },
+    {
+      "epoch": 0.84,
+      "eval_accuracy": 0.9502593270571827,
+      "eval_f1": 0.9502593270571827,
+      "eval_loss": 0.08298122137784958,
+      "eval_precision": 0.9502593270571827,
+      "eval_recall": 0.9502593270571827,
+      "eval_runtime": 70.5911,
+      "eval_samples_per_second": 141.363,
+      "eval_steps_per_second": 8.84,
+      "step": 2100
+    },
+    {
+      "epoch": 0.88,
+      "learning_rate": 1.118236472945892e-05,
+      "loss": 0.0895,
+      "step": 2200
+    },
+    {
+      "epoch": 0.88,
+      "eval_accuracy": 0.9504554567642957,
+      "eval_f1": 0.9504554567642957,
+      "eval_loss": 0.08282341808080673,
+      "eval_precision": 0.9504554567642957,
+      "eval_recall": 0.9504554567642957,
+      "eval_runtime": 69.735,
+      "eval_samples_per_second": 143.099,
+      "eval_steps_per_second": 8.948,
+      "step": 2200
+    },
+    {
+      "epoch": 0.92,
+      "learning_rate": 1.0781563126252506e-05,
+      "loss": 0.088,
+      "step": 2300
+    },
+    {
+      "epoch": 0.92,
+      "eval_accuracy": 0.9506080020920502,
+      "eval_f1": 0.9506080020920502,
+      "eval_loss": 0.08267684280872345,
+      "eval_precision": 0.9506080020920502,
+      "eval_recall": 0.9506080020920502,
+      "eval_runtime": 69.7037,
+      "eval_samples_per_second": 143.163,
+      "eval_steps_per_second": 8.952,
+      "step": 2300
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 1.0380761523046093e-05,
+      "loss": 0.0881,
+      "step": 2400
+    },
+    {
+      "epoch": 0.96,
+      "eval_accuracy": 0.9500359571129707,
+      "eval_f1": 0.9500359571129707,
+      "eval_loss": 0.08347389101982117,
+      "eval_precision": 0.9500359571129707,
+      "eval_recall": 0.9500359571129707,
+      "eval_runtime": 69.6797,
+      "eval_samples_per_second": 143.213,
+      "eval_steps_per_second": 8.955,
+      "step": 2400
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 9.97995991983968e-06,
+      "loss": 0.0842,
+      "step": 2500
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.9503955282426778,
+      "eval_f1": 0.9503955282426778,
+      "eval_loss": 0.08178979158401489,
+      "eval_precision": 0.9503955282426778,
+      "eval_recall": 0.9503955282426778,
+      "eval_runtime": 69.8247,
+      "eval_samples_per_second": 142.915,
+      "eval_steps_per_second": 8.937,
+      "step": 2500
+    }
+  ],
+  "logging_steps": 100,
+  "max_steps": 4990,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 2,
+  "save_steps": 500,
+  "total_flos": 5226212486332416.0,
+  "train_batch_size": 16,
+  "trial_name": null,
+  "trial_params": null
+}

distilbert-base-cased/checkpoint-2500/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:da0d85271a02ae6175d7c1e0b4bc6de536afd6c48c218ee02c7929cf1116aefd
+size 4728

distilbert-base-cased/checkpoint-2500/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

distilbert-base-cased/checkpoint-3000/config.json ADDED Viewed

	@@ -0,0 +1,57 @@

+{
+  "_name_or_path": "distilbert-base-cased",
+  "activation": "gelu",
+  "architectures": [
+    "DistilBertForTokenClassification"
+  ],
+  "attention_dropout": 0.1,
+  "dim": 768,
+  "dropout": 0.1,
+  "hidden_dim": 3072,
+  "id2label": {
+    "0": "B-ProductNameEn",
+    "1": "I-ProductNameEn",
+    "2": "B-TradeMarkEn",
+    "3": "I-TradeMarkEn",
+    "4": "B-Country",
+    "5": "I-Country",
+    "6": "B-HSCode",
+    "7": "I-HSCode",
+    "8": "B-HSCodeEn",
+    "9": "I-HSCodeEn",
+    "10": "B-ManufacturerEn",
+    "11": "I-ManufacturerEn",
+    "12": "B-ModelNo",
+    "13": "I-ModelNo"
+  },
+  "initializer_range": 0.02,
+  "label2id": {
+    "B-Country": 4,
+    "B-HSCode": 6,
+    "B-HSCodeEn": 8,
+    "B-ManufacturerEn": 10,
+    "B-ModelNo": 12,
+    "B-ProductNameEn": 0,
+    "B-TradeMarkEn": 2,
+    "I-Country": 5,
+    "I-HSCode": 7,
+    "I-HSCodeEn": 9,
+    "I-ManufacturerEn": 11,
+    "I-ModelNo": 13,
+    "I-ProductNameEn": 1,
+    "I-TradeMarkEn": 3
+  },
+  "max_position_embeddings": 512,
+  "model_type": "distilbert",
+  "n_heads": 12,
+  "n_layers": 6,
+  "output_past": true,
+  "pad_token_id": 0,
+  "qa_dropout": 0.1,
+  "seq_classif_dropout": 0.2,
+  "sinusoidal_pos_embds": false,
+  "tie_weights_": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.37.2",
+  "vocab_size": 28996
+}

distilbert-base-cased/checkpoint-3000/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e8fc26d248cdaccab3b9bdfde50bc4e3178ee79de1b8fba73d7b43f9f8bdf9a0
+size 260819048

distilbert-base-cased/checkpoint-3000/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:21db337f10ab5cc3307b13972bb3b25b437944fac31364b422e8231b16beab50
+size 521698874

distilbert-base-cased/checkpoint-3000/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9ba5fed01faf2db1d553b012b7f1ad7f7984ed16a93567e67404d6440f61714a
+size 14244

distilbert-base-cased/checkpoint-3000/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1c96ccfbb993c3b6d42e2452b8de60ed9ffa995f21987cc81ea4e361a437e336
+size 1064