Add evaluation results and output files to model card

Browse files

Files changed (15) hide show

README.md +36 -0
checkpoint-84/config.json +23 -0
checkpoint-84/model.safetensors +3 -0
checkpoint-84/optimizer.pt +3 -0
checkpoint-84/preprocessor_config.json +23 -0
checkpoint-84/rng_state.pth +3 -0
checkpoint-84/scheduler.pt +3 -0
checkpoint-84/trainer_state.json +840 -0
checkpoint-84/training_args.bin +3 -0
config.json +23 -0
model.safetensors +3 -0
pr_curve.png +0 -0
preprocessor_config.json +23 -0
roc_curve.png +0 -0
training_args.bin +3 -0

README.md ADDED Viewed

	@@ -0,0 +1,36 @@

+---
+language: code
+tags:
+  - binary-classification
+  - model
+  - evaluation
+metrics:
+  - average_precision: 0.50
+  - roc_auc: 0.37
+  - best threshold according to F1: 0.03
+---
+# Binary Classification Model
+## Evaluation Results
+**Average Precision:** 0.50
+**ROC AUC:** 0.37
+**best threshold according to F1: 0.03
+## Visualizations
+### Precision-Recall Curve
+![Precision-Recall Curve](./pr_curve.png)
+### ROC Curve
+![ROC Curve](./roc_curve.png)
+## Output Files and Directories
+- 📂 `checkpoint-171/`
+- `config.json`
+- `model.safetensors`
+- `preprocessor_config.json`
+- `training_args.bin`

checkpoint-84/config.json ADDED Viewed

	@@ -0,0 +1,23 @@

+{
+  "_name_or_path": "GenetikaPlus/binary_classification_model_v3.1.5_Junction",
+  "architectures": [
+    "ViTForImageClassification"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "encoder_stride": 16,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 256,
+  "image_size": 32,
+  "initializer_range": 0.02,
+  "intermediate_size": 512,
+  "layer_norm_eps": 1e-12,
+  "model_type": "vit",
+  "num_attention_heads": 8,
+  "num_channels": 3,
+  "num_hidden_layers": 4,
+  "patch_size": 4,
+  "qkv_bias": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.48.0"
+}

checkpoint-84/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:eeeac60794353121bf077b31d3539872cd5f5fd95e5f488b53128f4dd2804954
+size 8563512

checkpoint-84/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:463825b38620a46cd1ae415bb27541784040a351411f83c6f7792840c246b3da
+size 17171514

checkpoint-84/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,23 @@

+{
+  "do_convert_rgb": null,
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": false,
+  "image_mean": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "image_processor_type": "ViTFeatureExtractor",
+  "image_std": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "resample": 2,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "height": 32,
+    "width": 32
+  }
+}

checkpoint-84/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:965d5995676d59a44b47d9ced162417cf72cc56567ea7643d7e0802dcfc82c43
+size 14244

checkpoint-84/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3370cf7c7ef59896f4e4a55bcb471682405d2132b95a209aac680ae21fcb19b1
+size 1000

checkpoint-84/trainer_state.json ADDED Viewed

	@@ -0,0 +1,840 @@

+{
+  "best_metric": 0.7708737864077669,
+  "best_model_checkpoint": "/tmp/logs/binary_classification_model_v3.1.5_Junction_batch1/checkpoint-84",
+  "epoch": 14.0,
+  "eval_steps": 500,
+  "global_step": 84,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.16666666666666666,
+      "grad_norm": 736285.125,
+      "learning_rate": 0.00016666666666666666,
+      "loss": 0.7654,
+      "step": 1
+    },
+    {
+      "epoch": 0.3333333333333333,
+      "grad_norm": 1333572.375,
+      "learning_rate": 0.0003333333333333333,
+      "loss": 0.8052,
+      "step": 2
+    },
+    {
+      "epoch": 0.5,
+      "grad_norm": 1624097.125,
+      "learning_rate": 0.0005,
+      "loss": 2.2863,
+      "step": 3
+    },
+    {
+      "epoch": 0.6666666666666666,
+      "grad_norm": 671227.0625,
+      "learning_rate": 0.0006666666666666666,
+      "loss": 0.9079,
+      "step": 4
+    },
+    {
+      "epoch": 0.8333333333333334,
+      "grad_norm": 545356.625,
+      "learning_rate": 0.0008333333333333333,
+      "loss": 0.958,
+      "step": 5
+    },
+    {
+      "epoch": 1.0,
+      "grad_norm": 413819.90625,
+      "learning_rate": 0.001,
+      "loss": 0.856,
+      "step": 6
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.5584881068752037,
+      "eval_best_threshold": 0.5805500745773315,
+      "eval_f1": 0.7138331573389651,
+      "eval_loss": 0.6886702179908752,
+      "eval_pr_auc": 0.6352806545912864,
+      "eval_precision": 0.556470200856108,
+      "eval_recall": 0.9952885747938751,
+      "eval_roc_auc": 0.6032108397144622,
+      "eval_runtime": 2.3315,
+      "eval_samples_per_second": 1316.324,
+      "eval_steps_per_second": 2.573,
+      "step": 6
+    },
+    {
+      "epoch": 1.1666666666666667,
+      "grad_norm": 38779.44921875,
+      "learning_rate": 0.0011666666666666668,
+      "loss": 0.6853,
+      "step": 7
+    },
+    {
+      "epoch": 1.3333333333333333,
+      "grad_norm": 471674.8125,
+      "learning_rate": 0.0013333333333333333,
+      "loss": 0.8944,
+      "step": 8
+    },
+    {
+      "epoch": 1.5,
+      "grad_norm": 534391.0625,
+      "learning_rate": 0.0015,
+      "loss": 0.9852,
+      "step": 9
+    },
+    {
+      "epoch": 1.6666666666666665,
+      "grad_norm": 454181.25,
+      "learning_rate": 0.0016666666666666666,
+      "loss": 0.8852,
+      "step": 10
+    },
+    {
+      "epoch": 1.8333333333333335,
+      "grad_norm": 191708.96875,
+      "learning_rate": 0.0018333333333333333,
+      "loss": 0.7181,
+      "step": 11
+    },
+    {
+      "epoch": 2.0,
+      "grad_norm": 138568.640625,
+      "learning_rate": 0.002,
+      "loss": 0.7003,
+      "step": 12
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.5897686542847833,
+      "eval_best_threshold": 0.7087586522102356,
+      "eval_f1": 0.7176496972415339,
+      "eval_loss": 0.7489995956420898,
+      "eval_pr_auc": 0.6418343639245951,
+      "eval_precision": 0.5795001810938066,
+      "eval_recall": 0.9422850412249706,
+      "eval_roc_auc": 0.6285457040032509,
+      "eval_runtime": 2.4193,
+      "eval_samples_per_second": 1268.569,
+      "eval_steps_per_second": 2.48,
+      "step": 12
+    },
+    {
+      "epoch": 2.1666666666666665,
+      "grad_norm": 241500.28125,
+      "learning_rate": 0.002166666666666667,
+      "loss": 0.7381,
+      "step": 13
+    },
+    {
+      "epoch": 2.3333333333333335,
+      "grad_norm": 210473.890625,
+      "learning_rate": 0.0023333333333333335,
+      "loss": 0.7209,
+      "step": 14
+    },
+    {
+      "epoch": 2.5,
+      "grad_norm": 159988.078125,
+      "learning_rate": 0.0025,
+      "loss": 0.7087,
+      "step": 15
+    },
+    {
+      "epoch": 2.6666666666666665,
+      "grad_norm": 81561.6875,
+      "learning_rate": 0.0026666666666666666,
+      "loss": 0.685,
+      "step": 16
+    },
+    {
+      "epoch": 2.8333333333333335,
+      "grad_norm": 116087.46875,
+      "learning_rate": 0.002833333333333333,
+      "loss": 0.6949,
+      "step": 17
+    },
+    {
+      "epoch": 3.0,
+      "grad_norm": 89483.1953125,
+      "learning_rate": 0.003,
+      "loss": 0.6868,
+      "step": 18
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.6865428478331704,
+      "eval_best_threshold": 0.5599992275238037,
+      "eval_f1": 0.7575604838709677,
+      "eval_loss": 0.6744044423103333,
+      "eval_pr_auc": 0.6810929123667648,
+      "eval_precision": 0.6621145374449339,
+      "eval_recall": 0.8851590106007067,
+      "eval_roc_auc": 0.6815071405927426,
+      "eval_runtime": 2.5065,
+      "eval_samples_per_second": 1224.396,
+      "eval_steps_per_second": 2.394,
+      "step": 18
+    },
+    {
+      "epoch": 3.1666666666666665,
+      "grad_norm": 6684.7294921875,
+      "learning_rate": 0.0031666666666666666,
+      "loss": 0.6702,
+      "step": 19
+    },
+    {
+      "epoch": 3.3333333333333335,
+      "grad_norm": 209005.765625,
+      "learning_rate": 0.003333333333333333,
+      "loss": 0.7009,
+      "step": 20
+    },
+    {
+      "epoch": 3.5,
+      "grad_norm": 323864.125,
+      "learning_rate": 0.0034999999999999996,
+      "loss": 0.7666,
+      "step": 21
+    },
+    {
+      "epoch": 3.6666666666666665,
+      "grad_norm": 307526.84375,
+      "learning_rate": 0.0036666666666666666,
+      "loss": 0.7608,
+      "step": 22
+    },
+    {
+      "epoch": 3.8333333333333335,
+      "grad_norm": 156517.046875,
+      "learning_rate": 0.0038333333333333336,
+      "loss": 0.6678,
+      "step": 23
+    },
+    {
+      "epoch": 4.0,
+      "grad_norm": 174099.984375,
+      "learning_rate": 0.004,
+      "loss": 0.6636,
+      "step": 24
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.6881720430107527,
+      "eval_best_threshold": 0.30409353971481323,
+      "eval_f1": 0.7567979669631512,
+      "eval_loss": 0.7221760749816895,
+      "eval_pr_auc": 0.6879511756542679,
+      "eval_precision": 0.6656236030397854,
+      "eval_recall": 0.8769140164899882,
+      "eval_roc_auc": 0.6760302376589268,
+      "eval_runtime": 2.5115,
+      "eval_samples_per_second": 1221.98,
+      "eval_steps_per_second": 2.389,
+      "step": 24
+    },
+    {
+      "epoch": 4.166666666666667,
+      "grad_norm": 282579.03125,
+      "learning_rate": 0.004166666666666667,
+      "loss": 0.7214,
+      "step": 25
+    },
+    {
+      "epoch": 4.333333333333333,
+      "grad_norm": 263304.78125,
+      "learning_rate": 0.004333333333333334,
+      "loss": 0.7127,
+      "step": 26
+    },
+    {
+      "epoch": 4.5,
+      "grad_norm": 71898.953125,
+      "learning_rate": 0.0045000000000000005,
+      "loss": 0.6439,
+      "step": 27
+    },
+    {
+      "epoch": 4.666666666666667,
+      "grad_norm": 267385.34375,
+      "learning_rate": 0.004666666666666667,
+      "loss": 0.7345,
+      "step": 28
+    },
+    {
+      "epoch": 4.833333333333333,
+      "grad_norm": 274028.96875,
+      "learning_rate": 0.004833333333333334,
+      "loss": 0.7395,
+      "step": 29
+    },
+    {
+      "epoch": 5.0,
+      "grad_norm": 176626.65625,
+      "learning_rate": 0.005,
+      "loss": 0.6697,
+      "step": 30
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.6924079504724666,
+      "eval_best_threshold": 0.5539383292198181,
+      "eval_f1": 0.7580727831881087,
+      "eval_loss": 0.6356029510498047,
+      "eval_pr_auc": 0.6910960136731504,
+      "eval_precision": 0.6710526315789473,
+      "eval_recall": 0.8710247349823321,
+      "eval_roc_auc": 0.6834678718430487,
+      "eval_runtime": 2.4937,
+      "eval_samples_per_second": 1230.682,
+      "eval_steps_per_second": 2.406,
+      "step": 30
+    },
+    {
+      "epoch": 5.166666666666667,
+      "grad_norm": 14253.6220703125,
+      "learning_rate": 0.004999830770009406,
+      "loss": 0.6372,
+      "step": 31
+    },
+    {
+      "epoch": 5.333333333333333,
+      "grad_norm": 66843.328125,
+      "learning_rate": 0.004999323102948654,
+      "loss": 0.6313,
+      "step": 32
+    },
+    {
+      "epoch": 5.5,
+      "grad_norm": 15686.796875,
+      "learning_rate": 0.004998477067547739,
+      "loss": 0.6291,
+      "step": 33
+    },
+    {
+      "epoch": 5.666666666666667,
+      "grad_norm": 13507.8310546875,
+      "learning_rate": 0.004997292778346311,
+      "loss": 0.6279,
+      "step": 34
+    },
+    {
+      "epoch": 5.833333333333333,
+      "grad_norm": 133211.515625,
+      "learning_rate": 0.004995770395678171,
+      "loss": 0.6277,
+      "step": 35
+    },
+    {
+      "epoch": 6.0,
+      "grad_norm": 85637.015625,
+      "learning_rate": 0.004993910125649561,
+      "loss": 0.62,
+      "step": 36
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.6810035842293907,
+      "eval_best_threshold": 0.5501854419708252,
+      "eval_f1": 0.7665156212735511,
+      "eval_loss": 0.638248860836029,
+      "eval_pr_auc": 0.6844694185868021,
+      "eval_precision": 0.6440881763527054,
+      "eval_recall": 0.9464075382803298,
+      "eval_roc_auc": 0.6936909944251571,
+      "eval_runtime": 2.495,
+      "eval_samples_per_second": 1230.046,
+      "eval_steps_per_second": 2.405,
+      "step": 36
+    },
+    {
+      "epoch": 6.166666666666667,
+      "grad_norm": 157243.15625,
+      "learning_rate": 0.004991712220111265,
+      "loss": 0.6502,
+      "step": 37
+    },
+    {
+      "epoch": 6.333333333333333,
+      "grad_norm": 164708.90625,
+      "learning_rate": 0.004989176976624511,
+      "loss": 0.645,
+      "step": 38
+    },
+    {
+      "epoch": 6.5,
+      "grad_norm": 26995.654296875,
+      "learning_rate": 0.0049863047384206835,
+      "loss": 0.6175,
+      "step": 39
+    },
+    {
+      "epoch": 6.666666666666667,
+      "grad_norm": 27075.607421875,
+      "learning_rate": 0.004983095894354857,
+      "loss": 0.5887,
+      "step": 40
+    },
+    {
+      "epoch": 6.833333333333333,
+      "grad_norm": 99286.6328125,
+      "learning_rate": 0.0049795508788531544,
+      "loss": 0.5984,
+      "step": 41
+    },
+    {
+      "epoch": 7.0,
+      "grad_norm": 42803.4375,
+      "learning_rate": 0.004975670171853926,
+      "loss": 0.6223,
+      "step": 42
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 0.6842619745845552,
+      "eval_best_threshold": 0.36684346199035645,
+      "eval_f1": 0.7680153220014364,
+      "eval_loss": 0.6090383529663086,
+      "eval_pr_auc": 0.6967211615556601,
+      "eval_precision": 0.6470350947962888,
+      "eval_recall": 0.944640753828033,
+      "eval_roc_auc": 0.710033428438142,
+      "eval_runtime": 2.4866,
+      "eval_samples_per_second": 1234.232,
+      "eval_steps_per_second": 2.413,
+      "step": 42
+    },
+    {
+      "epoch": 7.166666666666667,
+      "grad_norm": 90881.265625,
+      "learning_rate": 0.004971454298742779,
+      "loss": 0.6043,
+      "step": 43
+    },
+    {
+      "epoch": 7.333333333333333,
+      "grad_norm": 9821.1396484375,
+      "learning_rate": 0.004966903830281449,
+      "loss": 0.6071,
+      "step": 44
+    },
+    {
+      "epoch": 7.5,
+      "grad_norm": 167938.828125,
+      "learning_rate": 0.00496201938253052,
+      "loss": 0.6508,
+      "step": 45
+    },
+    {
+      "epoch": 7.666666666666667,
+      "grad_norm": 45160.44140625,
+      "learning_rate": 0.0049568016167660335,
+      "loss": 0.6175,
+      "step": 46
+    },
+    {
+      "epoch": 7.833333333333333,
+      "grad_norm": 225251.8125,
+      "learning_rate": 0.004951251239389948,
+      "loss": 0.682,
+      "step": 47
+    },
+    {
+      "epoch": 8.0,
+      "grad_norm": 271435.625,
+      "learning_rate": 0.004945369001834514,
+      "loss": 0.7134,
+      "step": 48
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.6871945259042033,
+      "eval_best_threshold": 0.7288259863853455,
+      "eval_f1": 0.7659678205753291,
+      "eval_loss": 0.7107804417610168,
+      "eval_pr_auc": 0.6962413104496704,
+      "eval_precision": 0.6534941763727121,
+      "eval_recall": 0.925206124852768,
+      "eval_roc_auc": 0.7097486294855836,
+      "eval_runtime": 2.4945,
+      "eval_samples_per_second": 1230.312,
+      "eval_steps_per_second": 2.405,
+      "step": 48
+    },
+    {
+      "epoch": 8.166666666666666,
+      "grad_norm": 281774.375,
+      "learning_rate": 0.004939155700460536,
+      "loss": 0.7262,
+      "step": 49
+    },
+    {
+      "epoch": 8.333333333333334,
+      "grad_norm": 161943.453125,
+      "learning_rate": 0.004932612176449559,
+      "loss": 0.6575,
+      "step": 50
+    },
+    {
+      "epoch": 8.5,
+      "grad_norm": 36589.8828125,
+      "learning_rate": 0.004925739315689991,
+      "loss": 0.6269,
+      "step": 51
+    },
+    {
+      "epoch": 8.666666666666666,
+      "grad_norm": 81931.7265625,
+      "learning_rate": 0.00491853804865716,
+      "loss": 0.6326,
+      "step": 52
+    },
+    {
+      "epoch": 8.833333333333334,
+      "grad_norm": 26346.548828125,
+      "learning_rate": 0.004911009350287348,
+      "loss": 0.613,
+      "step": 53
+    },
+    {
+      "epoch": 9.0,
+      "grad_norm": 44889.1796875,
+      "learning_rate": 0.004903154239845798,
+      "loss": 0.6092,
+      "step": 54
+    },
+    {
+      "epoch": 9.0,
+      "eval_accuracy": 0.6855653307266211,
+      "eval_best_threshold": 0.451673686504364,
+      "eval_f1": 0.7684185265178786,
+      "eval_loss": 0.5992416739463806,
+      "eval_pr_auc": 0.6957104663478834,
+      "eval_precision": 0.648440664236533,
+      "eval_recall": 0.9428739693757362,
+      "eval_roc_auc": 0.7098253061266568,
+      "eval_runtime": 2.5332,
+      "eval_samples_per_second": 1211.496,
+      "eval_steps_per_second": 2.369,
+      "step": 54
+    },
+    {
+      "epoch": 9.166666666666666,
+      "grad_norm": 35008.66796875,
+      "learning_rate": 0.004894973780788722,
+      "loss": 0.6076,
+      "step": 55
+    },
+    {
+      "epoch": 9.333333333333334,
+      "grad_norm": 60022.11328125,
+      "learning_rate": 0.00488646908061933,
+      "loss": 0.6102,
+      "step": 56
+    },
+    {
+      "epoch": 9.5,
+      "grad_norm": 43722.4765625,
+      "learning_rate": 0.0048776412907378846,
+      "loss": 0.6014,
+      "step": 57
+    },
+    {
+      "epoch": 9.666666666666666,
+      "grad_norm": 79412.609375,
+      "learning_rate": 0.004868491606285823,
+      "loss": 0.6359,
+      "step": 58
+    },
+    {
+      "epoch": 9.833333333333334,
+      "grad_norm": 47201.9453125,
+      "learning_rate": 0.004859021265983959,
+      "loss": 0.617,
+      "step": 59
+    },
+    {
+      "epoch": 10.0,
+      "grad_norm": 74637.984375,
+      "learning_rate": 0.0048492315519647715,
+      "loss": 0.6094,
+      "step": 60
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy": 0.6946888237210818,
+      "eval_best_threshold": 0.4449542760848999,
+      "eval_f1": 0.7616382599847367,
+      "eval_loss": 0.6147498488426208,
+      "eval_pr_auc": 0.6914527562797227,
+      "eval_precision": 0.6703985669502911,
+      "eval_recall": 0.8816254416961131,
+      "eval_roc_auc": 0.7052023704895019,
+      "eval_runtime": 2.5228,
+      "eval_samples_per_second": 1216.496,
+      "eval_steps_per_second": 2.378,
+      "step": 60
+    },
+    {
+      "epoch": 10.166666666666666,
+      "grad_norm": 95656.8359375,
+      "learning_rate": 0.004839123789598829,
+      "loss": 0.6225,
+      "step": 61
+    },
+    {
+      "epoch": 10.333333333333334,
+      "grad_norm": 26628.71875,
+      "learning_rate": 0.004828699347315356,
+      "loss": 0.6025,
+      "step": 62
+    },
+    {
+      "epoch": 10.5,
+      "grad_norm": 97382.2421875,
+      "learning_rate": 0.004817959636416969,
+      "loss": 0.6135,
+      "step": 63
+    },
+    {
+      "epoch": 10.666666666666666,
+      "grad_norm": 110094.703125,
+      "learning_rate": 0.004806906110888606,
+      "loss": 0.6178,
+      "step": 64
+    },
+    {
+      "epoch": 10.833333333333334,
+      "grad_norm": 66554.7265625,
+      "learning_rate": 0.004795540267200685,
+      "loss": 0.607,
+      "step": 65
+    },
+    {
+      "epoch": 11.0,
+      "grad_norm": 106479.515625,
+      "learning_rate": 0.004783863644106502,
+      "loss": 0.6209,
+      "step": 66
+    },
+    {
+      "epoch": 11.0,
+      "eval_accuracy": 0.6852394916911045,
+      "eval_best_threshold": 0.3707140386104584,
+      "eval_f1": 0.7657613967022309,
+      "eval_loss": 0.6221640110015869,
+      "eval_pr_auc": 0.6986347246977063,
+      "eval_precision": 0.6508656224237428,
+      "eval_recall": 0.9299175500588928,
+      "eval_roc_auc": 0.7001586798387256,
+      "eval_runtime": 2.5822,
+      "eval_samples_per_second": 1188.505,
+      "eval_steps_per_second": 2.324,
+      "step": 66
+    },
+    {
+      "epoch": 11.166666666666666,
+      "grad_norm": 137435.59375,
+      "learning_rate": 0.004771877822433911,
+      "loss": 0.6311,
+      "step": 67
+    },
+    {
+      "epoch": 11.333333333333334,
+      "grad_norm": 83377.578125,
+      "learning_rate": 0.004759584424871301,
+      "loss": 0.6013,
+      "step": 68
+    },
+    {
+      "epoch": 11.5,
+      "grad_norm": 83074.90625,
+      "learning_rate": 0.004746985115747918,
+      "loss": 0.6002,
+      "step": 69
+    },
+    {
+      "epoch": 11.666666666666666,
+      "grad_norm": 158799.578125,
+      "learning_rate": 0.004734081600808531,
+      "loss": 0.6513,
+      "step": 70
+    },
+    {
+      "epoch": 11.833333333333334,
+      "grad_norm": 131248.9375,
+      "learning_rate": 0.00472087562698251,
+      "loss": 0.6265,
+      "step": 71
+    },
+    {
+      "epoch": 12.0,
+      "grad_norm": 47012.6796875,
+      "learning_rate": 0.0047073689821473174,
+      "loss": 0.5974,
+      "step": 72
+    },
+    {
+      "epoch": 12.0,
+      "eval_accuracy": 0.6871945259042033,
+      "eval_best_threshold": 0.3037373721599579,
+      "eval_f1": 0.7706641184902054,
+      "eval_loss": 0.6228871941566467,
+      "eval_pr_auc": 0.701660429140792,
+      "eval_precision": 0.6483118971061094,
+      "eval_recall": 0.9499411071849234,
+      "eval_roc_auc": 0.7101066685911,
+      "eval_runtime": 2.5154,
+      "eval_samples_per_second": 1220.097,
+      "eval_steps_per_second": 2.385,
+      "step": 72
+    },
+    {
+      "epoch": 12.166666666666666,
+      "grad_norm": 155522.734375,
+      "learning_rate": 0.004693563494886455,
+      "loss": 0.627,
+      "step": 73
+    },
+    {
+      "epoch": 12.333333333333334,
+      "grad_norm": 228481.4375,
+      "learning_rate": 0.0046794610342419055,
+      "loss": 0.6672,
+      "step": 74
+    },
+    {
+      "epoch": 12.5,
+      "grad_norm": 181537.359375,
+      "learning_rate": 0.004665063509461097,
+      "loss": 0.6483,
+      "step": 75
+    },
+    {
+      "epoch": 12.666666666666666,
+      "grad_norm": 106007.8359375,
+      "learning_rate": 0.004650372869738414,
+      "loss": 0.6159,
+      "step": 76
+    },
+    {
+      "epoch": 12.833333333333334,
+      "grad_norm": 29989.439453125,
+      "learning_rate": 0.0046353911039513146,
+      "loss": 0.608,
+      "step": 77
+    },
+    {
+      "epoch": 13.0,
+      "grad_norm": 78397.3125,
+      "learning_rate": 0.004620120240391065,
+      "loss": 0.607,
+      "step": 78
+    },
+    {
+      "epoch": 13.0,
+      "eval_accuracy": 0.6845878136200717,
+      "eval_best_threshold": 0.4396921992301941,
+      "eval_f1": 0.7661835748792271,
+      "eval_loss": 0.5964340567588806,
+      "eval_pr_auc": 0.7024174776610554,
+      "eval_precision": 0.6494676494676495,
+      "eval_recall": 0.934040047114252,
+      "eval_roc_auc": 0.7138369764402966,
+      "eval_runtime": 2.5505,
+      "eval_samples_per_second": 1203.299,
+      "eval_steps_per_second": 2.352,
+      "step": 78
+    },
+    {
+      "epoch": 13.166666666666666,
+      "grad_norm": 63548.2265625,
+      "learning_rate": 0.004604562346488143,
+      "loss": 0.6052,
+      "step": 79
+    },
+    {
+      "epoch": 13.333333333333334,
+      "grad_norm": 40460.96875,
+      "learning_rate": 0.004588719528532341,
+      "loss": 0.609,
+      "step": 80
+    },
+    {
+      "epoch": 13.5,
+      "grad_norm": 66499.796875,
+      "learning_rate": 0.004572593931387604,
+      "loss": 0.6036,
+      "step": 81
+    },
+    {
+      "epoch": 13.666666666666666,
+      "grad_norm": 50256.63671875,
+      "learning_rate": 0.004556187738201656,
+      "loss": 0.5862,
+      "step": 82
+    },
+    {
+      "epoch": 13.833333333333334,
+      "grad_norm": 67104.109375,
+      "learning_rate": 0.00453950317011043,
+      "loss": 0.6084,
+      "step": 83
+    },
+    {
+      "epoch": 14.0,
+      "grad_norm": 78011.8125,
+      "learning_rate": 0.0045225424859373685,
+      "loss": 0.6091,
+      "step": 84
+    },
+    {
+      "epoch": 14.0,
+      "eval_accuracy": 0.6924079504724666,
+      "eval_best_threshold": 0.4554637670516968,
+      "eval_f1": 0.7708737864077669,
+      "eval_loss": 0.5902236104011536,
+      "eval_pr_auc": 0.7002916428750828,
+      "eval_precision": 0.6556564822460776,
+      "eval_recall": 0.9352179034157833,
+      "eval_roc_auc": 0.7163127513468885,
+      "eval_runtime": 2.5694,
+      "eval_samples_per_second": 1194.43,
+      "eval_steps_per_second": 2.335,
+      "step": 84
+    }
+  ],
+  "logging_steps": 1,
+  "max_steps": 300,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 50,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 5,
+        "early_stopping_threshold": 0.0
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 0
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 6773336776507392.0,
+  "train_batch_size": 1024,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-84/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a63829309e19cfae4389603a792e6515e9c8585d46a666258924cab2c306c769
+size 5432

config.json ADDED Viewed

	@@ -0,0 +1,23 @@

+{
+  "_name_or_path": "GenetikaPlus/binary_classification_model_v3.1.5_Junction",
+  "architectures": [
+    "ViTForImageClassification"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "encoder_stride": 16,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 256,
+  "image_size": 32,
+  "initializer_range": 0.02,
+  "intermediate_size": 512,
+  "layer_norm_eps": 1e-12,
+  "model_type": "vit",
+  "num_attention_heads": 8,
+  "num_channels": 3,
+  "num_hidden_layers": 4,
+  "patch_size": 4,
+  "qkv_bias": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.48.0"
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:516e97c20ed900325d474136bb1fdf6f01e76f82cf984f06f99c325965d6a3b7
+size 8563512

pr_curve.png ADDED Viewed

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,23 @@

+{
+  "do_convert_rgb": null,
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": false,
+  "image_mean": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "image_processor_type": "ViTFeatureExtractor",
+  "image_std": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "resample": 2,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "height": 32,
+    "width": 32
+  }
+}

roc_curve.png ADDED Viewed

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a63829309e19cfae4389603a792e6515e9c8585d46a666258924cab2c306c769
+size 5432