MiniMedMind
/

checkpoint_MiniMedMind

Model card Files Files and versions Community

khanhduong commited on Oct 28, 2024

Commit

a928ef0

verified ·

1 Parent(s): 9dcc1b0

Upload log.txt with huggingface_hub

Browse files

Files changed (1) hide show

log.txt +3 -122

log.txt CHANGED Viewed

@@ -6,7 +6,7 @@
         "min_lr": 8e-05,
         "warmup_lr": 1e-06,
         "weight_decay": 0.05,
-        "max_epoch": 150,
         "batch_size_train": 120,
         "batch_size_eval": 3,
         "num_workers": 4,
@@ -15,7 +15,7 @@
         "seed": 42,
         "output_dir": "output/xraygpt_mimic_pretrain",
         "amp": true,
-        "resume_ckpt_path": "24_10_22_08_14_39_epoch99.pth",
         "evaluate": false,
         "train_splits": [
             "train"
@@ -81,123 +81,4 @@
         }
     }
 }
-{
-    "run": {
-        "task": "image_text_pretrain",
-        "lr_sched": "linear_warmup_cosine_lr",
-        "init_lr": 0.0001,
-        "min_lr": 8e-05,
-        "warmup_lr": 1e-06,
-        "weight_decay": 0.05,
-        "max_epoch": 150,
-        "batch_size_train": 120,
-        "batch_size_eval": 3,
-        "num_workers": 4,
-        "warmup_steps": 500,
-        "iters_per_epoch": 500,
-        "seed": 42,
-        "output_dir": "output/xraygpt_mimic_pretrain",
-        "amp": true,
-        "resume_ckpt_path": "24_10_22_08_14_39_epoch99.pth",
-        "evaluate": false,
-        "train_splits": [
-            "train"
-        ],
-        "device": "cuda",
-        "world_size": 4,
-        "dist_url": "env://",
-        "distributed": true,
-        "rank": 0,
-        "gpu": 0,
-        "dist_backend": "nccl"
-    },
-    "model": {
-        "arch": "mini_gpt4",
-        "image_size": 224,
-        "drop_path_rate": 0,
-        "use_grad_checkpoint": false,
-        "vit_precision": "fp16",
-        "freeze_vit": true,
-        "freeze_qformer": true,
-        "num_query_token": 32,
-        "llama_model": "Joycean0301/Llama-3.2-3B-Instruct-Medical-Conversational",
-        "prompt": "",
-        "model_type": "pretrain_vicuna"
-    },
-    "preprocess": {
-        "vis_processor": {
-            "train": {
-                "name": "blip2_image_train",
-                "image_size": 224
-            },
-            "eval": {
-                "name": "blip2_image_eval",
-                "image_size": 224
-            }
-        },
-        "text_processor": {
-            "train": {
-                "name": "blip_caption"
-            },
-            "eval": {
-                "name": "blip_caption"
-            }
-        }
-    },
-    "datasets": {
-        "mimic": {
-            "data_type": "images",
-            "build_info": {
-                "storage": "dataset/mimic"
-            },
-            "vis_processor": {
-                "train": {
-                    "name": "blip2_image_train",
-                    "image_size": 224
-                }
-            },
-            "text_processor": {
-                "train": {
-                    "name": "blip_caption"
-                }
-            }
-        }
-    }
-}
-{"train_lr": "0.000085", "train_loss": "1.176420"}
-{"train_lr": "0.000085", "train_loss": "1.175911"}
-{"train_lr": "0.000085", "train_loss": "1.177007"}
-{"train_lr": "0.000084", "train_loss": "1.174899"}
-{"train_lr": "0.000084", "train_loss": "1.176167"}
-{"train_lr": "0.000084", "train_loss": "1.175371"}
-{"train_lr": "0.000084", "train_loss": "1.175089"}
-{"train_lr": "0.000084", "train_loss": "1.174685"}
-{"train_lr": "0.000084", "train_loss": "1.173965"}
-{"train_lr": "0.000083", "train_loss": "1.173050"}
-{"train_lr": "0.000083", "train_loss": "1.174454"}
-{"train_lr": "0.000083", "train_loss": "1.174522"}
-{"train_lr": "0.000083", "train_loss": "1.171317"}
-{"train_lr": "0.000083", "train_loss": "1.173012"}
-{"train_lr": "0.000083", "train_loss": "1.173456"}
-{"train_lr": "0.000082", "train_loss": "1.172261"}
-{"train_lr": "0.000082", "train_loss": "1.171457"}
-{"train_lr": "0.000082", "train_loss": "1.172554"}
-{"train_lr": "0.000082", "train_loss": "1.169906"}
-{"train_lr": "0.000082", "train_loss": "1.171817"}
-{"train_lr": "0.000082", "train_loss": "1.170531"}
-{"train_lr": "0.000082", "train_loss": "1.170232"}
-{"train_lr": "0.000082", "train_loss": "1.171015"}
-{"train_lr": "0.000082", "train_loss": "1.169610"}
-{"train_lr": "0.000081", "train_loss": "1.170178"}
-{"train_lr": "0.000081", "train_loss": "1.169042"}
-{"train_lr": "0.000081", "train_loss": "1.170149"}
-{"train_lr": "0.000081", "train_loss": "1.168049"}
-{"train_lr": "0.000081", "train_loss": "1.169198"}
-{"train_lr": "0.000081", "train_loss": "1.169054"}
-{"train_lr": "0.000081", "train_loss": "1.168359"}
-{"train_lr": "0.000081", "train_loss": "1.168657"}
-{"train_lr": "0.000081", "train_loss": "1.168694"}
-{"train_lr": "0.000081", "train_loss": "1.168019"}
-{"train_lr": "0.000081", "train_loss": "1.167548"}
-{"train_lr": "0.000080", "train_loss": "1.165927"}
-{"train_lr": "0.000080", "train_loss": "1.168800"}

         "min_lr": 8e-05,
         "warmup_lr": 1e-06,
         "weight_decay": 0.05,
+        "max_epoch": 200,
         "batch_size_train": 120,
         "batch_size_eval": 3,
         "num_workers": 4,
         "seed": 42,
         "output_dir": "output/xraygpt_mimic_pretrain",
         "amp": true,
+        "resume_ckpt_path": "xraygpt/output/xraygpt_mimic_pretrain/20241028035/checkpoint_136.pth",
         "evaluate": false,
         "train_splits": [
             "train"
         }
     }
 }
+{"train_lr": "0.000084", "train_loss": "1.166641"}