ZivKassnerNK commited on Mar 17

Commit

e294472

1 Parent(s): 900d962

Add evaluation results and output files to model card

Browse files

Files changed (25) hide show

README.md +36 -0
checkpoint-140/config.json +24 -0
checkpoint-140/model.safetensors +3 -0
checkpoint-140/optimizer.pt +3 -0
checkpoint-140/preprocessor_config.json +23 -0
checkpoint-140/rng_state.pth +3 -0
checkpoint-140/scaler.pt +3 -0
checkpoint-140/scheduler.pt +3 -0
checkpoint-140/trainer_state.json +896 -0
checkpoint-140/training_args.bin +3 -0
checkpoint-60/config.json +24 -0
checkpoint-60/model.safetensors +3 -0
checkpoint-60/optimizer.pt +3 -0
checkpoint-60/preprocessor_config.json +23 -0
checkpoint-60/rng_state.pth +3 -0
checkpoint-60/scaler.pt +3 -0
checkpoint-60/scheduler.pt +3 -0
checkpoint-60/trainer_state.json +414 -0
checkpoint-60/training_args.bin +3 -0
config.json +24 -0
model.safetensors +3 -0
pr_curve.png +0 -0
preprocessor_config.json +23 -0
roc_curve.png +0 -0
training_args.bin +3 -0

README.md ADDED Viewed

	@@ -0,0 +1,36 @@

+---
+language: code
+tags:
+  - binary-classification
+  - model
+  - evaluation
+metrics:
+  - average_precision: 0.94
+  - roc_auc: 0.77
+  - best threshold according to F1: 0.35
+---
+# Binary Classification Model
+## Evaluation Results
+**Average Precision:** 0.94
+**ROC AUC:** 0.77
+**best threshold according to F1: 0.35
+## Visualizations
+### Precision-Recall Curve
+![Precision-Recall Curve](./pr_curve.png)
+### ROC Curve
+![ROC Curve](./roc_curve.png)
+## Output Files and Directories
+- 📂 `checkpoint-171/`
+- `config.json`
+- `model.safetensors`
+- `preprocessor_config.json`
+- `training_args.bin`

checkpoint-140/config.json ADDED Viewed

	@@ -0,0 +1,24 @@

+{
+  "_name_or_path": "google/vit-large-patch16-224-in21k",
+  "architectures": [
+    "ViTForImageClassification"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "encoder_stride": 16,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 1024,
+  "image_size": 256,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-12,
+  "model_type": "vit",
+  "num_attention_heads": 16,
+  "num_channels": 3,
+  "num_hidden_layers": 24,
+  "patch_size": 16,
+  "problem_type": "single_label_classification",
+  "qkv_bias": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.49.0"
+}

checkpoint-140/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:411bc377ee23010cd104a7db7aa3b35593fbc4aec8b99a0de7cf6d3aebe2e6d5
+size 1213507024

checkpoint-140/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fdb21d4fe924730bbaf2207322d323e644de556d92c10b5d68d054ca74f42ee3
+size 2427249066

checkpoint-140/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,23 @@

+{
+  "do_convert_rgb": null,
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": false,
+  "image_mean": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "image_processor_type": "ViTFeatureExtractor",
+  "image_std": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "resample": 2,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "height": 224,
+    "width": 224
+  }
+}

checkpoint-140/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f2f115a5be9979771da3a2b09f730d7ed2191451f3782c4df1f5bc84d6de6f11
+size 14244

checkpoint-140/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b7049f1e74bf3476ebf57f8bbfe08ec3a0311fb5d49b48b0e4a8fd2c8f05762f
+size 988

checkpoint-140/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:66c6a214ae787ddac4978d5c5b90944353a182391d33432e9f22fb5f397b5439
+size 1064

checkpoint-140/trainer_state.json ADDED Viewed

	@@ -0,0 +1,896 @@

+{
+  "best_metric": 0.9830508474576272,
+  "best_model_checkpoint": "/tmp/logs/GenetikaPlus/clf_soma_model_v1.0.1/checkpoint-60",
+  "epoch": 35.0,
+  "eval_steps": 500,
+  "global_step": 140,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.2857142857142857,
+      "grad_norm": 3.202357053756714,
+      "learning_rate": 8.333333333333333e-05,
+      "loss": 0.6786,
+      "step": 1
+    },
+    {
+      "epoch": 0.8571428571428571,
+      "grad_norm": 4.824620246887207,
+      "learning_rate": 0.00025,
+      "loss": 0.7317,
+      "step": 3
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.9577464788732394,
+      "eval_best_threshold": 0.3037576377391815,
+      "eval_f1": 0.9783132530120482,
+      "eval_loss": 0.6482536792755127,
+      "eval_pr_auc": 0.9798696623714835,
+      "eval_precision": 0.9575471698113207,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.7300492610837439,
+      "eval_runtime": 3.6503,
+      "eval_samples_per_second": 58.351,
+      "eval_steps_per_second": 1.096,
+      "step": 4
+    },
+    {
+      "epoch": 1.5714285714285714,
+      "grad_norm": 8.443906784057617,
+      "learning_rate": 0.0005,
+      "loss": 0.9287,
+      "step": 6
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.9577464788732394,
+      "eval_best_threshold": 0.09376094490289688,
+      "eval_f1": 0.9783132530120482,
+      "eval_loss": 1.2041555643081665,
+      "eval_pr_auc": 0.9823049604214897,
+      "eval_precision": 0.9575471698113207,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.7192118226600985,
+      "eval_runtime": 3.8529,
+      "eval_samples_per_second": 55.283,
+      "eval_steps_per_second": 1.038,
+      "step": 8
+    },
+    {
+      "epoch": 2.2857142857142856,
+      "grad_norm": 7.837808609008789,
+      "learning_rate": 0.0004999685319184688,
+      "loss": 1.0591,
+      "step": 9
+    },
+    {
+      "epoch": 3.0,
+      "grad_norm": 0.33617040514945984,
+      "learning_rate": 0.0004998741355957963,
+      "loss": 0.6429,
+      "step": 12
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.9530516431924883,
+      "eval_best_threshold": 0.11066323518753052,
+      "eval_f1": 0.9759615384615384,
+      "eval_loss": 0.6775969862937927,
+      "eval_pr_auc": 0.9570451344092105,
+      "eval_precision": 0.9530516431924883,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.4647783251231527,
+      "eval_runtime": 4.3875,
+      "eval_samples_per_second": 48.547,
+      "eval_steps_per_second": 0.912,
+      "step": 12
+    },
+    {
+      "epoch": 3.857142857142857,
+      "grad_norm": 2.0180256366729736,
+      "learning_rate": 0.000499716834795752,
+      "loss": 0.7296,
+      "step": 15
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.9577464788732394,
+      "eval_best_threshold": 0.488298624753952,
+      "eval_f1": 0.9783132530120482,
+      "eval_loss": 0.6953739523887634,
+      "eval_pr_auc": 0.9387681415619215,
+      "eval_precision": 0.9575471698113207,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.3980295566502463,
+      "eval_runtime": 3.9434,
+      "eval_samples_per_second": 54.014,
+      "eval_steps_per_second": 1.014,
+      "step": 16
+    },
+    {
+      "epoch": 4.571428571428571,
+      "grad_norm": 0.6065838932991028,
+      "learning_rate": 0.0004994966691179711,
+      "loss": 0.5691,
+      "step": 18
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.9577464788732394,
+      "eval_best_threshold": 0.4559290409088135,
+      "eval_f1": 0.9783132530120482,
+      "eval_loss": 0.6963727474212646,
+      "eval_pr_auc": 0.9437271902417405,
+      "eval_precision": 0.9575471698113207,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.42167487684729066,
+      "eval_runtime": 4.451,
+      "eval_samples_per_second": 47.854,
+      "eval_steps_per_second": 0.899,
+      "step": 20
+    },
+    {
+      "epoch": 5.285714285714286,
+      "grad_norm": 0.7243921160697937,
+      "learning_rate": 0.0004992136939879857,
+      "loss": 0.5782,
+      "step": 21
+    },
+    {
+      "epoch": 6.0,
+      "grad_norm": 0.2275872528553009,
+      "learning_rate": 0.0004988679806432712,
+      "loss": 0.5628,
+      "step": 24
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.9624413145539906,
+      "eval_best_threshold": 0.40434572100639343,
+      "eval_f1": 0.9806763285024155,
+      "eval_loss": 0.6847261786460876,
+      "eval_pr_auc": 0.9548760246480454,
+      "eval_precision": 0.9620853080568721,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.5586206896551724,
+      "eval_runtime": 4.6725,
+      "eval_samples_per_second": 45.586,
+      "eval_steps_per_second": 0.856,
+      "step": 24
+    },
+    {
+      "epoch": 6.857142857142857,
+      "grad_norm": 1.0703548192977905,
+      "learning_rate": 0.0004984596161153135,
+      "loss": 0.6532,
+      "step": 27
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 0.9624413145539906,
+      "eval_best_threshold": 0.3936326503753662,
+      "eval_f1": 0.9805825242718447,
+      "eval_loss": 0.6566980481147766,
+      "eval_pr_auc": 0.9620782247005666,
+      "eval_precision": 0.9665071770334929,
+      "eval_recall": 0.9950738916256158,
+      "eval_roc_auc": 0.5571428571428572,
+      "eval_runtime": 4.3448,
+      "eval_samples_per_second": 49.024,
+      "eval_steps_per_second": 0.921,
+      "step": 28
+    },
+    {
+      "epoch": 7.571428571428571,
+      "grad_norm": 2.041855573654175,
+      "learning_rate": 0.0004979887032076989,
+      "loss": 0.5593,
+      "step": 30
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.9624413145539906,
+      "eval_best_threshold": 0.2755194306373596,
+      "eval_f1": 0.9806763285024155,
+      "eval_loss": 0.6331985592842102,
+      "eval_pr_auc": 0.9751121096020542,
+      "eval_precision": 0.9620853080568721,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.6586206896551724,
+      "eval_runtime": 4.7804,
+      "eval_samples_per_second": 44.557,
+      "eval_steps_per_second": 0.837,
+      "step": 32
+    },
+    {
+      "epoch": 8.285714285714286,
+      "grad_norm": 0.8734021186828613,
+      "learning_rate": 0.0004974553604702333,
+      "loss": 0.5002,
+      "step": 33
+    },
+    {
+      "epoch": 9.0,
+      "grad_norm": Infinity,
+      "learning_rate": 0.0004970651810649666,
+      "loss": 0.5346,
+      "step": 36
+    },
+    {
+      "epoch": 9.0,
+      "eval_accuracy": 0.9577464788732394,
+      "eval_best_threshold": 0.14823205769062042,
+      "eval_f1": 0.9783132530120482,
+      "eval_loss": 0.6035900712013245,
+      "eval_pr_auc": 0.9819011692535515,
+      "eval_precision": 0.9575471698113207,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.7339901477832512,
+      "eval_runtime": 4.0039,
+      "eval_samples_per_second": 53.198,
+      "eval_steps_per_second": 0.999,
+      "step": 36
+    },
+    {
+      "epoch": 9.857142857142858,
+      "grad_norm": 1.1991403102874756,
+      "learning_rate": 0.0004964280947263676,
+      "loss": 0.5955,
+      "step": 39
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy": 0.9624413145539906,
+      "eval_best_threshold": 0.5386950373649597,
+      "eval_f1": 0.9805825242718447,
+      "eval_loss": 0.6214358806610107,
+      "eval_pr_auc": 0.9624581599102329,
+      "eval_precision": 0.9665071770334929,
+      "eval_recall": 0.9950738916256158,
+      "eval_roc_auc": 0.6002463054187192,
+      "eval_runtime": 4.5609,
+      "eval_samples_per_second": 46.701,
+      "eval_steps_per_second": 0.877,
+      "step": 40
+    },
+    {
+      "epoch": 10.571428571428571,
+      "grad_norm": 2.6938207149505615,
+      "learning_rate": 0.0004957289714327572,
+      "loss": 0.4496,
+      "step": 42
+    },
+    {
+      "epoch": 11.0,
+      "eval_accuracy": 0.9530516431924883,
+      "eval_best_threshold": 0.04157886654138565,
+      "eval_f1": 0.9759615384615384,
+      "eval_loss": 0.8543573617935181,
+      "eval_pr_auc": 0.9879501355451374,
+      "eval_precision": 0.9530516431924883,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.7901477832512316,
+      "eval_runtime": 4.6335,
+      "eval_samples_per_second": 45.969,
+      "eval_steps_per_second": 0.863,
+      "step": 44
+    },
+    {
+      "epoch": 11.285714285714286,
+      "grad_norm": 3.554097890853882,
+      "learning_rate": 0.0004949679871846857,
+      "loss": 0.6118,
+      "step": 45
+    },
+    {
+      "epoch": 12.0,
+      "grad_norm": 2.869584083557129,
+      "learning_rate": 0.0004941453335558681,
+      "loss": 0.6877,
+      "step": 48
+    },
+    {
+      "epoch": 12.0,
+      "eval_accuracy": 0.9530516431924883,
+      "eval_best_threshold": 0.17342814803123474,
+      "eval_f1": 0.9759615384615384,
+      "eval_loss": 0.5579107403755188,
+      "eval_pr_auc": 0.9873731974164195,
+      "eval_precision": 0.9530516431924883,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.7891625615763547,
+      "eval_runtime": 4.1544,
+      "eval_samples_per_second": 51.271,
+      "eval_steps_per_second": 0.963,
+      "step": 48
+    },
+    {
+      "epoch": 12.857142857142858,
+      "grad_norm": 1.1457290649414062,
+      "learning_rate": 0.0004932612176449559,
+      "loss": 0.5374,
+      "step": 51
+    },
+    {
+      "epoch": 13.0,
+      "eval_accuracy": 0.9624413145539906,
+      "eval_best_threshold": 0.5808722376823425,
+      "eval_f1": 0.9806763285024155,
+      "eval_loss": 0.5983880758285522,
+      "eval_pr_auc": 0.9837750859728142,
+      "eval_precision": 0.9620853080568721,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.7578817733990147,
+      "eval_runtime": 4.6879,
+      "eval_samples_per_second": 45.436,
+      "eval_steps_per_second": 0.853,
+      "step": 52
+    },
+    {
+      "epoch": 13.571428571428571,
+      "grad_norm": 2.2151918411254883,
+      "learning_rate": 0.000492315862023402,
+      "loss": 0.5329,
+      "step": 54
+    },
+    {
+      "epoch": 14.0,
+      "eval_accuracy": 0.9624413145539906,
+      "eval_best_threshold": 0.1792430430650711,
+      "eval_f1": 0.9806763285024155,
+      "eval_loss": 0.5941116213798523,
+      "eval_pr_auc": 0.987113937851267,
+      "eval_precision": 0.9620853080568721,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.7970443349753695,
+      "eval_runtime": 4.3199,
+      "eval_samples_per_second": 49.306,
+      "eval_steps_per_second": 0.926,
+      "step": 56
+    },
+    {
+      "epoch": 14.285714285714286,
+      "grad_norm": 2.5402119159698486,
+      "learning_rate": 0.0004913095046794281,
+      "loss": 0.4644,
+      "step": 57
+    },
+    {
+      "epoch": 15.0,
+      "grad_norm": 2.0666849613189697,
+      "learning_rate": 0.0004902423989581143,
+      "loss": 0.5655,
+      "step": 60
+    },
+    {
+      "epoch": 15.0,
+      "eval_accuracy": 0.9671361502347418,
+      "eval_best_threshold": 0.09999631345272064,
+      "eval_f1": 0.9830508474576272,
+      "eval_loss": 0.6284329891204834,
+      "eval_pr_auc": 0.9873903178253213,
+      "eval_precision": 0.9666666666666667,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.8014778325123153,
+      "eval_runtime": 3.9163,
+      "eval_samples_per_second": 54.388,
+      "eval_steps_per_second": 1.021,
+      "step": 60
+    },
+    {
+      "epoch": 15.857142857142858,
+      "grad_norm": 0.3262127935886383,
+      "learning_rate": 0.000489114813497619,
+      "loss": 0.5623,
+      "step": 63
+    },
+    {
+      "epoch": 16.0,
+      "eval_accuracy": 0.9624413145539906,
+      "eval_best_threshold": 0.40762078762054443,
+      "eval_f1": 0.9806763285024155,
+      "eval_loss": 0.5445640683174133,
+      "eval_pr_auc": 0.9843443641688615,
+      "eval_precision": 0.9620853080568721,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.7625615763546798,
+      "eval_runtime": 4.4164,
+      "eval_samples_per_second": 48.229,
+      "eval_steps_per_second": 0.906,
+      "step": 64
+    },
+    {
+      "epoch": 16.571428571428573,
+      "grad_norm": 1.1104872226715088,
+      "learning_rate": 0.000487927032161552,
+      "loss": 0.4934,
+      "step": 66
+    },
+    {
+      "epoch": 17.0,
+      "eval_accuracy": 0.9624413145539906,
+      "eval_best_threshold": 0.08254930377006531,
+      "eval_f1": 0.9806763285024155,
+      "eval_loss": 0.5435951352119446,
+      "eval_pr_auc": 0.9867802837753047,
+      "eval_precision": 0.9620853080568721,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.7965517241379311,
+      "eval_runtime": 4.8194,
+      "eval_samples_per_second": 44.197,
+      "eval_steps_per_second": 0.83,
+      "step": 68
+    },
+    {
+      "epoch": 17.285714285714285,
+      "grad_norm": 1.3775012493133545,
+      "learning_rate": 0.00048667935396751264,
+      "loss": 0.4147,
+      "step": 69
+    },
+    {
+      "epoch": 18.0,
+      "grad_norm": 0.987482488155365,
+      "learning_rate": 0.0004853720930118139,
+      "loss": 0.4838,
+      "step": 72
+    },
+    {
+      "epoch": 18.0,
+      "eval_accuracy": 0.9624413145539906,
+      "eval_best_threshold": 0.2583727538585663,
+      "eval_f1": 0.9806763285024155,
+      "eval_loss": 0.5534961223602295,
+      "eval_pr_auc": 0.9766965382800533,
+      "eval_precision": 0.9620853080568721,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.6854679802955665,
+      "eval_runtime": 4.4444,
+      "eval_samples_per_second": 47.926,
+      "eval_steps_per_second": 0.9,
+      "step": 72
+    },
+    {
+      "epoch": 18.857142857142858,
+      "grad_norm": 0.7703476548194885,
+      "learning_rate": 0.00048400557839041057,
+      "loss": 0.5121,
+      "step": 75
+    },
+    {
+      "epoch": 19.0,
+      "eval_accuracy": 0.9624413145539906,
+      "eval_best_threshold": 0.06578465551137924,
+      "eval_f1": 0.9806763285024155,
+      "eval_loss": 0.5378168225288391,
+      "eval_pr_auc": 0.9891977624351356,
+      "eval_precision": 0.9620853080568721,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.8330049261083744,
+      "eval_runtime": 4.5334,
+      "eval_samples_per_second": 46.984,
+      "eval_steps_per_second": 0.882,
+      "step": 76
+    },
+    {
+      "epoch": 19.571428571428573,
+      "grad_norm": 1.074415922164917,
+      "learning_rate": 0.00048258015411605095,
+      "loss": 0.4896,
+      "step": 78
+    },
+    {
+      "epoch": 20.0,
+      "eval_accuracy": 0.9624413145539906,
+      "eval_best_threshold": 0.29690900444984436,
+      "eval_f1": 0.9806763285024155,
+      "eval_loss": 0.57256019115448,
+      "eval_pr_auc": 0.9841532218125894,
+      "eval_precision": 0.9620853080568721,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.758128078817734,
+      "eval_runtime": 4.6069,
+      "eval_samples_per_second": 46.235,
+      "eval_steps_per_second": 0.868,
+      "step": 80
+    },
+    {
+      "epoch": 20.285714285714285,
+      "grad_norm": 2.890902042388916,
+      "learning_rate": 0.00048109617903167303,
+      "loss": 0.403,
+      "step": 81
+    },
+    {
+      "epoch": 21.0,
+      "grad_norm": 0.32196927070617676,
+      "learning_rate": 0.0004795540267200685,
+      "loss": 0.4986,
+      "step": 84
+    },
+    {
+      "epoch": 21.0,
+      "eval_accuracy": 0.9624413145539906,
+      "eval_best_threshold": 0.24242974817752838,
+      "eval_f1": 0.9806763285024155,
+      "eval_loss": 0.5482825040817261,
+      "eval_pr_auc": 0.9836054537100154,
+      "eval_precision": 0.9620853080568721,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.7773399014778325,
+      "eval_runtime": 4.3525,
+      "eval_samples_per_second": 48.938,
+      "eval_steps_per_second": 0.919,
+      "step": 84
+    },
+    {
+      "epoch": 21.857142857142858,
+      "grad_norm": 0.31015127897262573,
+      "learning_rate": 0.00047795408540983475,
+      "loss": 0.532,
+      "step": 87
+    },
+    {
+      "epoch": 22.0,
+      "eval_accuracy": 0.9624413145539906,
+      "eval_best_threshold": 0.07094483077526093,
+      "eval_f1": 0.9806763285024155,
+      "eval_loss": 0.5339506268501282,
+      "eval_pr_auc": 0.9872064689219997,
+      "eval_precision": 0.9620853080568721,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.8167487684729065,
+      "eval_runtime": 4.5492,
+      "eval_samples_per_second": 46.822,
+      "eval_steps_per_second": 0.879,
+      "step": 88
+    },
+    {
+      "epoch": 22.571428571428573,
+      "grad_norm": 0.4279550313949585,
+      "learning_rate": 0.0004762967578776406,
+      "loss": 0.4404,
+      "step": 90
+    },
+    {
+      "epoch": 23.0,
+      "eval_accuracy": 0.9671361502347418,
+      "eval_best_threshold": 0.4337865710258484,
+      "eval_f1": 0.9830508474576272,
+      "eval_loss": 0.5571203231811523,
+      "eval_pr_auc": 0.9819982800942599,
+      "eval_precision": 0.9666666666666667,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.7495073891625617,
+      "eval_runtime": 4.8091,
+      "eval_samples_per_second": 44.291,
+      "eval_steps_per_second": 0.832,
+      "step": 92
+    },
+    {
+      "epoch": 23.285714285714285,
+      "grad_norm": 1.652251958847046,
+      "learning_rate": 0.00047458246134682926,
+      "loss": 0.4665,
+      "step": 93
+    },
+    {
+      "epoch": 24.0,
+      "grad_norm": 0.5141251087188721,
+      "learning_rate": 0.0004728116273823847,
+      "loss": 0.473,
+      "step": 96
+    },
+    {
+      "epoch": 24.0,
+      "eval_accuracy": 0.9671361502347418,
+      "eval_best_threshold": 0.32589587569236755,
+      "eval_f1": 0.9830508474576272,
+      "eval_loss": 0.5704872012138367,
+      "eval_pr_auc": 0.9865814075621451,
+      "eval_precision": 0.9666666666666667,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.7926108374384236,
+      "eval_runtime": 4.3422,
+      "eval_samples_per_second": 49.054,
+      "eval_steps_per_second": 0.921,
+      "step": 96
+    },
+    {
+      "epoch": 24.857142857142858,
+      "grad_norm": 2.2477593421936035,
+      "learning_rate": 0.0004709847017822876,
+      "loss": 0.578,
+      "step": 99
+    },
+    {
+      "epoch": 25.0,
+      "eval_accuracy": 0.9671361502347418,
+      "eval_best_threshold": 0.32844865322113037,
+      "eval_f1": 0.9830508474576272,
+      "eval_loss": 0.5548251271247864,
+      "eval_pr_auc": 0.9830996192936517,
+      "eval_precision": 0.9666666666666667,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.7620689655172413,
+      "eval_runtime": 4.2924,
+      "eval_samples_per_second": 49.623,
+      "eval_steps_per_second": 0.932,
+      "step": 100
+    },
+    {
+      "epoch": 25.571428571428573,
+      "grad_norm": 3.829688310623169,
+      "learning_rate": 0.00046910214446528766,
+      "loss": 0.4749,
+      "step": 102
+    },
+    {
+      "epoch": 26.0,
+      "eval_accuracy": 0.9624413145539906,
+      "eval_best_threshold": 0.0979498103260994,
+      "eval_f1": 0.9806763285024155,
+      "eval_loss": 0.4922328591346741,
+      "eval_pr_auc": 0.9846144860590845,
+      "eval_precision": 0.9620853080568721,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.7921182266009853,
+      "eval_runtime": 4.1671,
+      "eval_samples_per_second": 51.115,
+      "eval_steps_per_second": 0.96,
+      "step": 104
+    },
+    {
+      "epoch": 26.285714285714285,
+      "grad_norm": 0.6822347044944763,
+      "learning_rate": 0.00046716442935512215,
+      "loss": 0.4634,
+      "step": 105
+    },
+    {
+      "epoch": 27.0,
+      "grad_norm": 0.3724188506603241,
+      "learning_rate": 0.00046517204426120757,
+      "loss": 0.3946,
+      "step": 108
+    },
+    {
+      "epoch": 27.0,
+      "eval_accuracy": 0.9671361502347418,
+      "eval_best_threshold": 0.14669741690158844,
+      "eval_f1": 0.9830508474576272,
+      "eval_loss": 0.5319708585739136,
+      "eval_pr_auc": 0.9846531299061106,
+      "eval_precision": 0.9666666666666667,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.7795566502463055,
+      "eval_runtime": 4.0384,
+      "eval_samples_per_second": 52.743,
+      "eval_steps_per_second": 0.99,
+      "step": 108
+    },
+    {
+      "epoch": 27.857142857142858,
+      "grad_norm": 3.3339312076568604,
+      "learning_rate": 0.0004631254907558365,
+      "loss": 0.6008,
+      "step": 111
+    },
+    {
+      "epoch": 28.0,
+      "eval_accuracy": 0.9624413145539906,
+      "eval_best_threshold": 0.4017758369445801,
+      "eval_f1": 0.9804878048780488,
+      "eval_loss": 0.4973604679107666,
+      "eval_pr_auc": 0.9854492936449624,
+      "eval_precision": 0.9710144927536232,
+      "eval_recall": 0.9901477832512315,
+      "eval_roc_auc": 0.7903940886699506,
+      "eval_runtime": 4.4645,
+      "eval_samples_per_second": 47.71,
+      "eval_steps_per_second": 0.896,
+      "step": 112
+    },
+    {
+      "epoch": 28.571428571428573,
+      "grad_norm": 1.0172795057296753,
+      "learning_rate": 0.00046102528404790965,
+      "loss": 0.52,
+      "step": 114
+    },
+    {
+      "epoch": 29.0,
+      "eval_accuracy": 0.9577464788732394,
+      "eval_best_threshold": 0.02784844860434532,
+      "eval_f1": 0.9783132530120482,
+      "eval_loss": 0.5491310358047485,
+      "eval_pr_auc": 0.986877369995463,
+      "eval_precision": 0.9575471698113207,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.8157635467980296,
+      "eval_runtime": 4.223,
+      "eval_samples_per_second": 50.438,
+      "eval_steps_per_second": 0.947,
+      "step": 116
+    },
+    {
+      "epoch": 29.285714285714285,
+      "grad_norm": 1.3928241729736328,
+      "learning_rate": 0.0004588719528532341,
+      "loss": 0.4332,
+      "step": 117
+    },
+    {
+      "epoch": 30.0,
+      "grad_norm": 0.13795076310634613,
+      "learning_rate": 0.00045666603926142283,
+      "loss": 0.3921,
+      "step": 120
+    },
+    {
+      "epoch": 30.0,
+      "eval_accuracy": 0.9624413145539906,
+      "eval_best_threshold": 0.3900836706161499,
+      "eval_f1": 0.9805825242718447,
+      "eval_loss": 0.5215495228767395,
+      "eval_pr_auc": 0.9885726401668996,
+      "eval_precision": 0.9665071770334929,
+      "eval_recall": 0.9950738916256158,
+      "eval_roc_auc": 0.8231527093596059,
+      "eval_runtime": 3.9438,
+      "eval_samples_per_second": 54.008,
+      "eval_steps_per_second": 1.014,
+      "step": 120
+    },
+    {
+      "epoch": 30.857142857142858,
+      "grad_norm": 1.1264947652816772,
+      "learning_rate": 0.0004544080985994258,
+      "loss": 0.4964,
+      "step": 123
+    },
+    {
+      "epoch": 31.0,
+      "eval_accuracy": 0.9624413145539906,
+      "eval_best_threshold": 0.06064055114984512,
+      "eval_f1": 0.9806763285024155,
+      "eval_loss": 0.5333446264266968,
+      "eval_pr_auc": 0.9872200029984016,
+      "eval_precision": 0.9620853080568721,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.8251231527093597,
+      "eval_runtime": 4.334,
+      "eval_samples_per_second": 49.147,
+      "eval_steps_per_second": 0.923,
+      "step": 124
+    },
+    {
+      "epoch": 31.571428571428573,
+      "grad_norm": 1.147207260131836,
+      "learning_rate": 0.0004520986992917297,
+      "loss": 0.4592,
+      "step": 126
+    },
+    {
+      "epoch": 32.0,
+      "eval_accuracy": 0.9671361502347418,
+      "eval_best_threshold": 0.2888699173927307,
+      "eval_f1": 0.9829683698296837,
+      "eval_loss": 0.47561803460121155,
+      "eval_pr_auc": 0.98778851386531,
+      "eval_precision": 0.9711538461538461,
+      "eval_recall": 0.9950738916256158,
+      "eval_roc_auc": 0.8290640394088671,
+      "eval_runtime": 4.5973,
+      "eval_samples_per_second": 46.331,
+      "eval_steps_per_second": 0.87,
+      "step": 128
+    },
+    {
+      "epoch": 32.285714285714285,
+      "grad_norm": 0.5480005145072937,
+      "learning_rate": 0.00044973842271726027,
+      "loss": 0.4054,
+      "step": 129
+    },
+    {
+      "epoch": 33.0,
+      "grad_norm": 1.6971485614776611,
+      "learning_rate": 0.00044732786306302303,
+      "loss": 0.476,
+      "step": 132
+    },
+    {
+      "epoch": 33.0,
+      "eval_accuracy": 0.9671361502347418,
+      "eval_best_threshold": 0.2422952502965927,
+      "eval_f1": 0.9830508474576272,
+      "eval_loss": 0.47018811106681824,
+      "eval_pr_auc": 0.989969192055292,
+      "eval_precision": 0.9666666666666667,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.8450738916256157,
+      "eval_runtime": 4.2741,
+      "eval_samples_per_second": 49.835,
+      "eval_steps_per_second": 0.936,
+      "step": 132
+    },
+    {
+      "epoch": 33.857142857142854,
+      "grad_norm": 1.4494688510894775,
+      "learning_rate": 0.0004448676271745197,
+      "loss": 0.5734,
+      "step": 135
+    },
+    {
+      "epoch": 34.0,
+      "eval_accuracy": 0.9671361502347418,
+      "eval_best_threshold": 0.22772686183452606,
+      "eval_f1": 0.9830508474576272,
+      "eval_loss": 0.47546666860580444,
+      "eval_pr_auc": 0.9894810176977142,
+      "eval_precision": 0.9666666666666667,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.8379310344827586,
+      "eval_runtime": 4.3512,
+      "eval_samples_per_second": 48.952,
+      "eval_steps_per_second": 0.919,
+      "step": 136
+    },
+    {
+      "epoch": 34.57142857142857,
+      "grad_norm": 0.8203570246696472,
+      "learning_rate": 0.00044235833440297857,
+      "loss": 0.3077,
+      "step": 138
+    },
+    {
+      "epoch": 35.0,
+      "eval_accuracy": 0.9624413145539906,
+      "eval_best_threshold": 0.05028397589921951,
+      "eval_f1": 0.9806763285024155,
+      "eval_loss": 0.46481361985206604,
+      "eval_pr_auc": 0.9884215676732423,
+      "eval_precision": 0.9620853080568721,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.8428571428571429,
+      "eval_runtime": 4.0747,
+      "eval_samples_per_second": 52.274,
+      "eval_steps_per_second": 0.982,
+      "step": 140
+    }
+  ],
+  "logging_steps": 3,
+  "max_steps": 600,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 200,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 20,
+        "early_stopping_threshold": 0.0
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 20
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 1.0621405284091822e+19,
+  "train_batch_size": 128,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-140/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f603d30a49833e95de39ef9d1ed2771533f8d9b708df00b15be6b4ad228368bd
+size 5368

checkpoint-60/config.json ADDED Viewed

	@@ -0,0 +1,24 @@

+{
+  "_name_or_path": "google/vit-large-patch16-224-in21k",
+  "architectures": [
+    "ViTForImageClassification"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "encoder_stride": 16,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 1024,
+  "image_size": 256,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-12,
+  "model_type": "vit",
+  "num_attention_heads": 16,
+  "num_channels": 3,
+  "num_hidden_layers": 24,
+  "patch_size": 16,
+  "problem_type": "single_label_classification",
+  "qkv_bias": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.49.0"
+}

checkpoint-60/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e7603c376108527effe45eab5fca348a5c0335c2c3085408192150b8fbdd97a3
+size 1213507024

checkpoint-60/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a91bc74d81e2604b56d12ab5149b6c8668a2b2d367b45e22218bc28b40009614
+size 2427249066

checkpoint-60/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,23 @@

+{
+  "do_convert_rgb": null,
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": false,
+  "image_mean": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "image_processor_type": "ViTFeatureExtractor",
+  "image_std": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "resample": 2,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "height": 224,
+    "width": 224
+  }
+}

checkpoint-60/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:88a8c6076f3c05cdf1125c1235b4a613ac1ac913542e9b26d9987d0d57db6272
+size 14244

checkpoint-60/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a7565f867f9c8d3f5c8aa2ea6bd211664218909ee6750a4ca50a8bb62aa0732f
+size 988

checkpoint-60/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4f881e0232dd1e145e78a55a6abf77ba5bec2e9fb9008686b6cf1fbde772fafb
+size 1064

checkpoint-60/trainer_state.json ADDED Viewed

	@@ -0,0 +1,414 @@

+{
+  "best_metric": 0.9830508474576272,
+  "best_model_checkpoint": "/tmp/logs/GenetikaPlus/clf_soma_model_v1.0.1/checkpoint-60",
+  "epoch": 15.0,
+  "eval_steps": 500,
+  "global_step": 60,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.2857142857142857,
+      "grad_norm": 3.202357053756714,
+      "learning_rate": 8.333333333333333e-05,
+      "loss": 0.6786,
+      "step": 1
+    },
+    {
+      "epoch": 0.8571428571428571,
+      "grad_norm": 4.824620246887207,
+      "learning_rate": 0.00025,
+      "loss": 0.7317,
+      "step": 3
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.9577464788732394,
+      "eval_best_threshold": 0.3037576377391815,
+      "eval_f1": 0.9783132530120482,
+      "eval_loss": 0.6482536792755127,
+      "eval_pr_auc": 0.9798696623714835,
+      "eval_precision": 0.9575471698113207,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.7300492610837439,
+      "eval_runtime": 3.6503,
+      "eval_samples_per_second": 58.351,
+      "eval_steps_per_second": 1.096,
+      "step": 4
+    },
+    {
+      "epoch": 1.5714285714285714,
+      "grad_norm": 8.443906784057617,
+      "learning_rate": 0.0005,
+      "loss": 0.9287,
+      "step": 6
+    },
+    {
+      "epoch": 2.0,
+      "eval_accuracy": 0.9577464788732394,
+      "eval_best_threshold": 0.09376094490289688,
+      "eval_f1": 0.9783132530120482,
+      "eval_loss": 1.2041555643081665,
+      "eval_pr_auc": 0.9823049604214897,
+      "eval_precision": 0.9575471698113207,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.7192118226600985,
+      "eval_runtime": 3.8529,
+      "eval_samples_per_second": 55.283,
+      "eval_steps_per_second": 1.038,
+      "step": 8
+    },
+    {
+      "epoch": 2.2857142857142856,
+      "grad_norm": 7.837808609008789,
+      "learning_rate": 0.0004999685319184688,
+      "loss": 1.0591,
+      "step": 9
+    },
+    {
+      "epoch": 3.0,
+      "grad_norm": 0.33617040514945984,
+      "learning_rate": 0.0004998741355957963,
+      "loss": 0.6429,
+      "step": 12
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.9530516431924883,
+      "eval_best_threshold": 0.11066323518753052,
+      "eval_f1": 0.9759615384615384,
+      "eval_loss": 0.6775969862937927,
+      "eval_pr_auc": 0.9570451344092105,
+      "eval_precision": 0.9530516431924883,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.4647783251231527,
+      "eval_runtime": 4.3875,
+      "eval_samples_per_second": 48.547,
+      "eval_steps_per_second": 0.912,
+      "step": 12
+    },
+    {
+      "epoch": 3.857142857142857,
+      "grad_norm": 2.0180256366729736,
+      "learning_rate": 0.000499716834795752,
+      "loss": 0.7296,
+      "step": 15
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.9577464788732394,
+      "eval_best_threshold": 0.488298624753952,
+      "eval_f1": 0.9783132530120482,
+      "eval_loss": 0.6953739523887634,
+      "eval_pr_auc": 0.9387681415619215,
+      "eval_precision": 0.9575471698113207,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.3980295566502463,
+      "eval_runtime": 3.9434,
+      "eval_samples_per_second": 54.014,
+      "eval_steps_per_second": 1.014,
+      "step": 16
+    },
+    {
+      "epoch": 4.571428571428571,
+      "grad_norm": 0.6065838932991028,
+      "learning_rate": 0.0004994966691179711,
+      "loss": 0.5691,
+      "step": 18
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.9577464788732394,
+      "eval_best_threshold": 0.4559290409088135,
+      "eval_f1": 0.9783132530120482,
+      "eval_loss": 0.6963727474212646,
+      "eval_pr_auc": 0.9437271902417405,
+      "eval_precision": 0.9575471698113207,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.42167487684729066,
+      "eval_runtime": 4.451,
+      "eval_samples_per_second": 47.854,
+      "eval_steps_per_second": 0.899,
+      "step": 20
+    },
+    {
+      "epoch": 5.285714285714286,
+      "grad_norm": 0.7243921160697937,
+      "learning_rate": 0.0004992136939879857,
+      "loss": 0.5782,
+      "step": 21
+    },
+    {
+      "epoch": 6.0,
+      "grad_norm": 0.2275872528553009,
+      "learning_rate": 0.0004988679806432712,
+      "loss": 0.5628,
+      "step": 24
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.9624413145539906,
+      "eval_best_threshold": 0.40434572100639343,
+      "eval_f1": 0.9806763285024155,
+      "eval_loss": 0.6847261786460876,
+      "eval_pr_auc": 0.9548760246480454,
+      "eval_precision": 0.9620853080568721,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.5586206896551724,
+      "eval_runtime": 4.6725,
+      "eval_samples_per_second": 45.586,
+      "eval_steps_per_second": 0.856,
+      "step": 24
+    },
+    {
+      "epoch": 6.857142857142857,
+      "grad_norm": 1.0703548192977905,
+      "learning_rate": 0.0004984596161153135,
+      "loss": 0.6532,
+      "step": 27
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 0.9624413145539906,
+      "eval_best_threshold": 0.3936326503753662,
+      "eval_f1": 0.9805825242718447,
+      "eval_loss": 0.6566980481147766,
+      "eval_pr_auc": 0.9620782247005666,
+      "eval_precision": 0.9665071770334929,
+      "eval_recall": 0.9950738916256158,
+      "eval_roc_auc": 0.5571428571428572,
+      "eval_runtime": 4.3448,
+      "eval_samples_per_second": 49.024,
+      "eval_steps_per_second": 0.921,
+      "step": 28
+    },
+    {
+      "epoch": 7.571428571428571,
+      "grad_norm": 2.041855573654175,
+      "learning_rate": 0.0004979887032076989,
+      "loss": 0.5593,
+      "step": 30
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.9624413145539906,
+      "eval_best_threshold": 0.2755194306373596,
+      "eval_f1": 0.9806763285024155,
+      "eval_loss": 0.6331985592842102,
+      "eval_pr_auc": 0.9751121096020542,
+      "eval_precision": 0.9620853080568721,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.6586206896551724,
+      "eval_runtime": 4.7804,
+      "eval_samples_per_second": 44.557,
+      "eval_steps_per_second": 0.837,
+      "step": 32
+    },
+    {
+      "epoch": 8.285714285714286,
+      "grad_norm": 0.8734021186828613,
+      "learning_rate": 0.0004974553604702333,
+      "loss": 0.5002,
+      "step": 33
+    },
+    {
+      "epoch": 9.0,
+      "grad_norm": Infinity,
+      "learning_rate": 0.0004970651810649666,
+      "loss": 0.5346,
+      "step": 36
+    },
+    {
+      "epoch": 9.0,
+      "eval_accuracy": 0.9577464788732394,
+      "eval_best_threshold": 0.14823205769062042,
+      "eval_f1": 0.9783132530120482,
+      "eval_loss": 0.6035900712013245,
+      "eval_pr_auc": 0.9819011692535515,
+      "eval_precision": 0.9575471698113207,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.7339901477832512,
+      "eval_runtime": 4.0039,
+      "eval_samples_per_second": 53.198,
+      "eval_steps_per_second": 0.999,
+      "step": 36
+    },
+    {
+      "epoch": 9.857142857142858,
+      "grad_norm": 1.1991403102874756,
+      "learning_rate": 0.0004964280947263676,
+      "loss": 0.5955,
+      "step": 39
+    },
+    {
+      "epoch": 10.0,
+      "eval_accuracy": 0.9624413145539906,
+      "eval_best_threshold": 0.5386950373649597,
+      "eval_f1": 0.9805825242718447,
+      "eval_loss": 0.6214358806610107,
+      "eval_pr_auc": 0.9624581599102329,
+      "eval_precision": 0.9665071770334929,
+      "eval_recall": 0.9950738916256158,
+      "eval_roc_auc": 0.6002463054187192,
+      "eval_runtime": 4.5609,
+      "eval_samples_per_second": 46.701,
+      "eval_steps_per_second": 0.877,
+      "step": 40
+    },
+    {
+      "epoch": 10.571428571428571,
+      "grad_norm": 2.6938207149505615,
+      "learning_rate": 0.0004957289714327572,
+      "loss": 0.4496,
+      "step": 42
+    },
+    {
+      "epoch": 11.0,
+      "eval_accuracy": 0.9530516431924883,
+      "eval_best_threshold": 0.04157886654138565,
+      "eval_f1": 0.9759615384615384,
+      "eval_loss": 0.8543573617935181,
+      "eval_pr_auc": 0.9879501355451374,
+      "eval_precision": 0.9530516431924883,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.7901477832512316,
+      "eval_runtime": 4.6335,
+      "eval_samples_per_second": 45.969,
+      "eval_steps_per_second": 0.863,
+      "step": 44
+    },
+    {
+      "epoch": 11.285714285714286,
+      "grad_norm": 3.554097890853882,
+      "learning_rate": 0.0004949679871846857,
+      "loss": 0.6118,
+      "step": 45
+    },
+    {
+      "epoch": 12.0,
+      "grad_norm": 2.869584083557129,
+      "learning_rate": 0.0004941453335558681,
+      "loss": 0.6877,
+      "step": 48
+    },
+    {
+      "epoch": 12.0,
+      "eval_accuracy": 0.9530516431924883,
+      "eval_best_threshold": 0.17342814803123474,
+      "eval_f1": 0.9759615384615384,
+      "eval_loss": 0.5579107403755188,
+      "eval_pr_auc": 0.9873731974164195,
+      "eval_precision": 0.9530516431924883,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.7891625615763547,
+      "eval_runtime": 4.1544,
+      "eval_samples_per_second": 51.271,
+      "eval_steps_per_second": 0.963,
+      "step": 48
+    },
+    {
+      "epoch": 12.857142857142858,
+      "grad_norm": 1.1457290649414062,
+      "learning_rate": 0.0004932612176449559,
+      "loss": 0.5374,
+      "step": 51
+    },
+    {
+      "epoch": 13.0,
+      "eval_accuracy": 0.9624413145539906,
+      "eval_best_threshold": 0.5808722376823425,
+      "eval_f1": 0.9806763285024155,
+      "eval_loss": 0.5983880758285522,
+      "eval_pr_auc": 0.9837750859728142,
+      "eval_precision": 0.9620853080568721,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.7578817733990147,
+      "eval_runtime": 4.6879,
+      "eval_samples_per_second": 45.436,
+      "eval_steps_per_second": 0.853,
+      "step": 52
+    },
+    {
+      "epoch": 13.571428571428571,
+      "grad_norm": 2.2151918411254883,
+      "learning_rate": 0.000492315862023402,
+      "loss": 0.5329,
+      "step": 54
+    },
+    {
+      "epoch": 14.0,
+      "eval_accuracy": 0.9624413145539906,
+      "eval_best_threshold": 0.1792430430650711,
+      "eval_f1": 0.9806763285024155,
+      "eval_loss": 0.5941116213798523,
+      "eval_pr_auc": 0.987113937851267,
+      "eval_precision": 0.9620853080568721,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.7970443349753695,
+      "eval_runtime": 4.3199,
+      "eval_samples_per_second": 49.306,
+      "eval_steps_per_second": 0.926,
+      "step": 56
+    },
+    {
+      "epoch": 14.285714285714286,
+      "grad_norm": 2.5402119159698486,
+      "learning_rate": 0.0004913095046794281,
+      "loss": 0.4644,
+      "step": 57
+    },
+    {
+      "epoch": 15.0,
+      "grad_norm": 2.0666849613189697,
+      "learning_rate": 0.0004902423989581143,
+      "loss": 0.5655,
+      "step": 60
+    },
+    {
+      "epoch": 15.0,
+      "eval_accuracy": 0.9671361502347418,
+      "eval_best_threshold": 0.09999631345272064,
+      "eval_f1": 0.9830508474576272,
+      "eval_loss": 0.6284329891204834,
+      "eval_pr_auc": 0.9873903178253213,
+      "eval_precision": 0.9666666666666667,
+      "eval_recall": 1.0,
+      "eval_roc_auc": 0.8014778325123153,
+      "eval_runtime": 3.9163,
+      "eval_samples_per_second": 54.388,
+      "eval_steps_per_second": 1.021,
+      "step": 60
+    }
+  ],
+  "logging_steps": 3,
+  "max_steps": 600,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 200,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 20,
+        "early_stopping_threshold": 0.0
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 0
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": false
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 4.5520308360393523e+18,
+  "train_batch_size": 128,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-60/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f603d30a49833e95de39ef9d1ed2771533f8d9b708df00b15be6b4ad228368bd
+size 5368

config.json ADDED Viewed

	@@ -0,0 +1,24 @@

+{
+  "_name_or_path": "google/vit-large-patch16-224-in21k",
+  "architectures": [
+    "ViTForImageClassification"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "encoder_stride": 16,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 1024,
+  "image_size": 256,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-12,
+  "model_type": "vit",
+  "num_attention_heads": 16,
+  "num_channels": 3,
+  "num_hidden_layers": 24,
+  "patch_size": 16,
+  "problem_type": "single_label_classification",
+  "qkv_bias": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.49.0"
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7de864ac2885746ef4be671e778f1df03aee0141c6847dbba7da6de34864c462
+size 1213507024

pr_curve.png ADDED Viewed

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,23 @@

+{
+  "do_convert_rgb": null,
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": false,
+  "image_mean": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "image_processor_type": "ViTFeatureExtractor",
+  "image_std": [
+    0.5,
+    0.5,
+    0.5
+  ],
+  "resample": 2,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "height": 224,
+    "width": 224
+  }
+}

roc_curve.png ADDED Viewed

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f603d30a49833e95de39ef9d1ed2771533f8d9b708df00b15be6b4ad228368bd
+size 5368