htlou commited on Jan 5

Commit

3c469b6

verified ·

1 Parent(s): dd7cde8

Upload folder using huggingface_hub

Browse files

Files changed (27) hide show

.gitattributes +1 -0
arguments.yaml +51 -0
config.json +0 -0
environ.txt +164 -0
preprocessor_config.json +28 -0
processor_config.json +5 -0
pytorch_model.bin +3 -0
script.sh +84 -0
special_tokens_map.json +37 -0
tokenizer.json +0 -0
tokenizer_config.json +0 -0
wandb/debug-internal.log +20 -0
wandb/debug.log +33 -0
wandb/run-20250101_031915-9dphq5gk/files/output.log +2 -0
wandb/run-20250101_031915-9dphq5gk/files/requirements.txt +248 -0
wandb/run-20250101_031915-9dphq5gk/files/wandb-metadata.json +112 -0
wandb/run-20250101_031915-9dphq5gk/logs/debug-internal.log +10 -0
wandb/run-20250101_031915-9dphq5gk/logs/debug.log +26 -0
wandb/run-20250101_031915-9dphq5gk/run-9dphq5gk.wandb +0 -0
wandb/run-20250101_032225-2bzz3n13/files/config.yaml +98 -0
wandb/run-20250101_032225-2bzz3n13/files/output.log +47 -0
wandb/run-20250101_032225-2bzz3n13/files/requirements.txt +248 -0
wandb/run-20250101_032225-2bzz3n13/files/wandb-metadata.json +112 -0
wandb/run-20250101_032225-2bzz3n13/files/wandb-summary.json +1 -0
wandb/run-20250101_032225-2bzz3n13/logs/debug-internal.log +20 -0
wandb/run-20250101_032225-2bzz3n13/logs/debug.log +33 -0
wandb/run-20250101_032225-2bzz3n13/run-2bzz3n13.wandb +3 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+wandb/run-20250101_032225-2bzz3n13/run-2bzz3n13.wandb filter=lfs diff=lfs merge=lfs -text

arguments.yaml ADDED Viewed

	@@ -0,0 +1,51 @@

+data_cfgs:
+  eval_data_files: null
+  eval_datasets: null
+  eval_optional_args: []
+  eval_size: null
+  eval_split: null
+  eval_subset: null
+  eval_template: null
+  train_data_files: q0_10_preference.pt
+  train_datasets: /data/align-anything/hantao/data/mm_interp/AA_preference_cocour_new_step10/tokenized
+  train_optional_args: []
+  train_size: null
+  train_split: train
+  train_subset: null
+  train_template: Chameleon_preference
+logger_cfgs:
+  cache_dir: null
+  log_project: align-anything
+  log_run_name: dpo
+  log_type: wandb
+  output_dir: /data/align-anything/hantao/align-anything/outputs/mm_interp//q0_10_preference
+  save_interval: 400.0
+model_cfgs:
+  model_max_length: 4096
+  model_name_or_path: /data/align-anything/hantao/models/chameleon-7b
+  trust_remote_code: true
+special_tokens: null
+train_cfgs:
+  adam_betas:
+  - 0.9
+  - 0.95
+  bf16: true
+  ds_cfgs: ds_z3_config.json
+  epochs: 3.0
+  eval_interval: 10
+  eval_strategy: epoch
+  fp16: false
+  freeze_language_model: true
+  freeze_mm_proj: true
+  freeze_vision_tower: false
+  gradient_accumulation_steps: 2.0
+  gradient_checkpointing: true
+  learning_rate: 1.0e-06
+  lr_scheduler_type: cosine
+  lr_warmup_ratio: 0.03
+  per_device_eval_batch_size: 4.0
+  per_device_train_batch_size: 4.0
+  regularization: 0.001
+  scale_coeff: 0.1
+  seed: 42
+  weight_decay: 0.01

config.json ADDED Viewed

The diff for this file is too large to render. See raw diff

environ.txt ADDED Viewed

	@@ -0,0 +1,164 @@

+ADDR2LINE=/data/align-anything/miniconda3/envs/jy-a/bin/x86_64-conda-linux-gnu-addr2line
+AR=/data/align-anything/miniconda3/envs/jy-a/bin/x86_64-conda-linux-gnu-ar
+AS=/data/align-anything/miniconda3/envs/jy-a/bin/x86_64-conda-linux-gnu-as
+BROWSER=/home/align-anything/.cursor-server/cli/servers/Stable-51c8aff7cb5a89f4a0e462fbacab938bdbfaf140/server/bin/helpers/browser.sh
+BUILD=x86_64-conda-linux-gnu
+CC=/data/align-anything/miniconda3/envs/hantao_stable/bin/gcc
+CC_FOR_BUILD=/data/align-anything/miniconda3/envs/jy-a/bin/x86_64-conda-linux-gnu-cc
+CFLAGS=-march=nocona -mtune=haswell -ftree-vectorize -fPIC -fstack-protector-strong -fno-plt -O2 -ffunction-sections -pipe -isystem /data/align-anything/miniconda3/envs/jy-a/include -march=nocona -mtune=haswell -ftree-vectorize -fPIC -fstack-protector-strong -fno-plt -O2 -ffunction-sections -pipe -isystem /data/align-anything/miniconda3/envs/jy-a/include  -I/data/align-anything/miniconda3/envs/jy-a/targets/x86_64-linux/include  -L/data/align-anything/miniconda3/envs/jy-a/targets/x86_64-linux/lib -L/data/align-anything/miniconda3/envs/jy-a/targets/x86_64-linux/lib/stubs
+CMAKE_PREFIX_PATH=/data/align-anything/miniconda3/envs/jy-a:/data/align-anything/miniconda3/envs/jy-a/x86_64-conda-linux-gnu/sysroot/usr
+COLORTERM=truecolor
+CONDA_BACKUP_ADDR2LINE=/data/align-anything/miniconda3/envs/hantao_proxy/bin/x86_64-conda-linux-gnu-addr2line
+CONDA_BACKUP_AR=/data/align-anything/miniconda3/envs/hantao_proxy/bin/x86_64-conda-linux-gnu-ar
+CONDA_BACKUP_AS=/data/align-anything/miniconda3/envs/hantao_proxy/bin/x86_64-conda-linux-gnu-as
+CONDA_BACKUP_BUILD=x86_64-conda-linux-gnu
+CONDA_BACKUP_CC=/data/align-anything/miniconda3/envs/hantao_proxy/bin/x86_64-conda-linux-gnu-cc
+CONDA_BACKUP_CC_FOR_BUILD=/data/align-anything/miniconda3/envs/hantao_proxy/bin/x86_64-conda-linux-gnu-cc
+CONDA_BACKUP_CFLAGS=-march=nocona -mtune=haswell -ftree-vectorize -fPIC -fstack-protector-strong -fno-plt -O2 -ffunction-sections -pipe -isystem /data/align-anything/miniconda3/envs/hantao_proxy/include -march=nocona -mtune=haswell -ftree-vectorize -fPIC -fstack-protector-strong -fno-plt -O2 -ffunction-sections -pipe -isystem /data/align-anything/miniconda3/envs/hantao_proxy/include -march=nocona -mtune=haswell -ftree-vectorize -fPIC -fstack-protector-strong -fno-plt -O2 -ffunction-sections -pipe -isystem /data/align-anything/miniconda3/envs/jy-a/include -march=nocona -mtune=haswell -ftree-vectorize -fPIC -fstack-protector-strong -fno-plt -O2 -ffunction-sections -pipe -isystem /data/align-anything/miniconda3/envs/jy-a/include  -I/data/align-anything/miniconda3/envs/jy-a/targets/x86_64-linux/include  -L/data/align-anything/miniconda3/envs/jy-a/targets/x86_64-linux/lib -L/data/align-anything/miniconda3/envs/jy-a/targets/x86_64-linux/lib/stubs  -I/data/align-anything/miniconda3/envs/hantao_proxy/targets/x86_64-linux/include
+CONDA_BACKUP_CMAKE_PREFIX_PATH=/data/align-anything/miniconda3/envs/hantao_proxy:/data/align-anything/miniconda3/envs/hantao_proxy/x86_64-conda-linux-gnu/sysroot/usr
+CONDA_BACKUP_CONDA_BUILD_SYSROOT=/data/align-anything/miniconda3/envs/hantao_proxy/x86_64-conda-linux-gnu/sysroot
+CONDA_BACKUP_CONDA_TOOLCHAIN_BUILD=x86_64-conda-linux-gnu
+CONDA_BACKUP_CONDA_TOOLCHAIN_HOST=x86_64-conda-linux-gnu
+CONDA_BACKUP_CPP=/data/align-anything/miniconda3/envs/hantao_proxy/bin/x86_64-conda-linux-gnu-cpp
+CONDA_BACKUP_CPPFLAGS=-DNDEBUG -D_FORTIFY_SOURCE=2 -O2 -isystem /data/align-anything/miniconda3/envs/hantao_proxy/include -DNDEBUG -D_FORTIFY_SOURCE=2 -O2 -isystem /data/align-anything/miniconda3/envs/hantao_proxy/include -DNDEBUG -D_FORTIFY_SOURCE=2 -O2 -isystem /data/align-anything/miniconda3/envs/jy-a/include -DNDEBUG -D_FORTIFY_SOURCE=2 -O2 -isystem /data/align-anything/miniconda3/envs/jy-a/include  -I/data/align-anything/miniconda3/envs/jy-a/targets/x86_64-linux/include  -L/data/align-anything/miniconda3/envs/jy-a/targets/x86_64-linux/lib -L/data/align-anything/miniconda3/envs/jy-a/targets/x86_64-linux/lib/stubs  -I/data/align-anything/miniconda3/envs/hantao_proxy/targets/x86_64-linux/include
+CONDA_BACKUP_CXX=/data/align-anything/miniconda3/envs/hantao_proxy/bin/x86_64-conda-linux-gnu-c++
+CONDA_BACKUP_CXXFILT=/data/align-anything/miniconda3/envs/hantao_proxy/bin/x86_64-conda-linux-gnu-c++filt
+CONDA_BACKUP_CXXFLAGS=-fvisibility-inlines-hidden -fmessage-length=0 -march=nocona -mtune=haswell -ftree-vectorize -fPIC -fstack-protector-strong -fno-plt -O2 -ffunction-sections -pipe -isystem /data/align-anything/miniconda3/envs/hantao_proxy/include -fvisibility-inlines-hidden -fmessage-length=0 -march=nocona -mtune=haswell -ftree-vectorize -fPIC -fstack-protector-strong -fno-plt -O2 -ffunction-sections -pipe -isystem /data/align-anything/miniconda3/envs/hantao_proxy/include -fvisibility-inlines-hidden -fmessage-length=0 -march=nocona -mtune=haswell -ftree-vectorize -fPIC -fstack-protector-strong -fno-plt -O2 -ffunction-sections -pipe -isystem /data/align-anything/miniconda3/envs/jy-a/include -fvisibility-inlines-hidden -fmessage-length=0 -march=nocona -mtune=haswell -ftree-vectorize -fPIC -fstack-protector-strong -fno-plt -O2 -ffunction-sections -pipe -isystem /data/align-anything/miniconda3/envs/jy-a/include  -I/data/align-anything/miniconda3/envs/jy-a/targets/x86_64-linux/include  -L/data/align-anything/miniconda3/envs/jy-a/targets/x86_64-linux/lib -L/data/align-anything/miniconda3/envs/jy-a/targets/x86_64-linux/lib/stubs  -I/data/align-anything/miniconda3/envs/hantao_proxy/targets/x86_64-linux/include
+CONDA_BACKUP_CXX_FOR_BUILD=/data/align-anything/miniconda3/envs/hantao_proxy/bin/x86_64-conda-linux-gnu-c++
+CONDA_BACKUP_DEBUG_CFLAGS=-march=nocona -mtune=haswell -ftree-vectorize -fPIC -fstack-protector-all -fno-plt -Og -g -Wall -Wextra -fvar-tracking-assignments -ffunction-sections -pipe -isystem /data/align-anything/miniconda3/envs/hantao_proxy/include -march=nocona -mtune=haswell -ftree-vectorize -fPIC -fstack-protector-all -fno-plt -Og -g -Wall -Wextra -fvar-tracking-assignments -ffunction-sections -pipe -isystem /data/align-anything/miniconda3/envs/hantao_proxy/include -march=nocona -mtune=haswell -ftree-vectorize -fPIC -fstack-protector-all -fno-plt -Og -g -Wall -Wextra -fvar-tracking-assignments -ffunction-sections -pipe -isystem /data/align-anything/miniconda3/envs/jy-a/include -march=nocona -mtune=haswell -ftree-vectorize -fPIC -fstack-protector-all -fno-plt -Og -g -Wall -Wextra -fvar-tracking-assignments -ffunction-sections -pipe -isystem /data/align-anything/miniconda3/envs/jy-a/include
+CONDA_BACKUP_DEBUG_CPPFLAGS=-D_DEBUG -D_FORTIFY_SOURCE=2 -Og -isystem /data/align-anything/miniconda3/envs/hantao_proxy/include -D_DEBUG -D_FORTIFY_SOURCE=2 -Og -isystem /data/align-anything/miniconda3/envs/hantao_proxy/include -D_DEBUG -D_FORTIFY_SOURCE=2 -Og -isystem /data/align-anything/miniconda3/envs/jy-a/include -D_DEBUG -D_FORTIFY_SOURCE=2 -Og -isystem /data/align-anything/miniconda3/envs/jy-a/include
+CONDA_BACKUP_DEBUG_CXXFLAGS=-fvisibility-inlines-hidden -fmessage-length=0 -march=nocona -mtune=haswell -ftree-vectorize -fPIC -fstack-protector-all -fno-plt -Og -g -Wall -Wextra -fvar-tracking-assignments -ffunction-sections -pipe -isystem /data/align-anything/miniconda3/envs/hantao_proxy/include -fvisibility-inlines-hidden -fmessage-length=0 -march=nocona -mtune=haswell -ftree-vectorize -fPIC -fstack-protector-all -fno-plt -Og -g -Wall -Wextra -fvar-tracking-assignments -ffunction-sections -pipe -isystem /data/align-anything/miniconda3/envs/hantao_proxy/include -fvisibility-inlines-hidden -fmessage-length=0 -march=nocona -mtune=haswell -ftree-vectorize -fPIC -fstack-protector-all -fno-plt -Og -g -Wall -Wextra -fvar-tracking-assignments -ffunction-sections -pipe -isystem /data/align-anything/miniconda3/envs/jy-a/include -fvisibility-inlines-hidden -fmessage-length=0 -march=nocona -mtune=haswell -ftree-vectorize -fPIC -fstack-protector-all -fno-plt -Og -g -Wall -Wextra -fvar-tracking-assignments -ffunction-sections -pipe -isystem /data/align-anything/miniconda3/envs/jy-a/include
+CONDA_BACKUP_DWP=/data/align-anything/miniconda3/envs/hantao_proxy/bin/x86_64-conda-linux-gnu-dwp
+CONDA_BACKUP_ELFEDIT=/data/align-anything/miniconda3/envs/hantao_proxy/bin/x86_64-conda-linux-gnu-elfedit
+CONDA_BACKUP_GCC=/data/align-anything/miniconda3/envs/hantao_proxy/bin/x86_64-conda-linux-gnu-gcc
+CONDA_BACKUP_GCC_AR=/data/align-anything/miniconda3/envs/hantao_proxy/bin/x86_64-conda-linux-gnu-gcc-ar
+CONDA_BACKUP_GCC_NM=/data/align-anything/miniconda3/envs/hantao_proxy/bin/x86_64-conda-linux-gnu-gcc-nm
+CONDA_BACKUP_GCC_RANLIB=/data/align-anything/miniconda3/envs/hantao_proxy/bin/x86_64-conda-linux-gnu-gcc-ranlib
+CONDA_BACKUP_GPROF=/data/align-anything/miniconda3/envs/hantao_proxy/bin/x86_64-conda-linux-gnu-gprof
+CONDA_BACKUP_GXX=/data/align-anything/miniconda3/envs/hantao_proxy/bin/x86_64-conda-linux-gnu-g++
+CONDA_BACKUP_HOST=x86_64-conda-linux-gnu
+CONDA_BACKUP_LD=/data/align-anything/miniconda3/envs/hantao_proxy/bin/x86_64-conda-linux-gnu-ld
+CONDA_BACKUP_LDFLAGS=-Wl,-O2 -Wl,--sort-common -Wl,--as-needed -Wl,-z,relro -Wl,-z,now -Wl,--disable-new-dtags -Wl,--gc-sections -Wl,--allow-shlib-undefined -Wl,-rpath,/data/align-anything/miniconda3/envs/hantao_proxy/lib -Wl,-rpath-link,/data/align-anything/miniconda3/envs/hantao_proxy/lib -L/data/align-anything/miniconda3/envs/hantao_proxy/lib -Wl,-O2 -Wl,--sort-common -Wl,--as-needed -Wl,-z,relro -Wl,-z,now -Wl,--disable-new-dtags -Wl,--gc-sections -Wl,--allow-shlib-undefined -Wl,-rpath,/data/align-anything/miniconda3/envs/hantao_proxy/lib -Wl,-rpath-link,/data/align-anything/miniconda3/envs/hantao_proxy/lib -L/data/align-anything/miniconda3/envs/hantao_proxy/lib -Wl,-O2 -Wl,--sort-common -Wl,--as-needed -Wl,-z,relro -Wl,-z,now -Wl,--disable-new-dtags -Wl,--gc-sections -Wl,--allow-shlib-undefined -Wl,-rpath,/data/align-anything/miniconda3/envs/jy-a/lib -Wl,-rpath-link,/data/align-anything/miniconda3/envs/jy-a/lib -L/data/align-anything/miniconda3/envs/jy-a/lib -Wl,-O2 -Wl,--sort-common -Wl,--as-needed -Wl,-z,relro -Wl,-z,now -Wl,--disable-new-dtags -Wl,--gc-sections -Wl,--allow-shlib-undefined -Wl,-rpath,/data/align-anything/miniconda3/envs/jy-a/lib -Wl,-rpath-link,/data/align-anything/miniconda3/envs/jy-a/lib -L/data/align-anything/miniconda3/envs/jy-a/lib  -L/data/align-anything/miniconda3/envs/jy-a/targets/x86_64-linux/lib -L/data/align-anything/miniconda3/envs/jy-a/targets/x86_64-linux/lib/stubs  -L/data/align-anything/miniconda3/envs/hantao_proxy/targets/x86_64-linux/lib -L/data/align-anything/miniconda3/envs/hantao_proxy/targets/x86_64-linux/lib/stubs
+CONDA_BACKUP_LD_GOLD=/data/align-anything/miniconda3/envs/hantao_proxy/bin/x86_64-conda-linux-gnu-ld.gold
+CONDA_BACKUP_MESON_ARGS=-Dbuildtype=release
+CONDA_BACKUP_NM=/data/align-anything/miniconda3/envs/hantao_proxy/bin/x86_64-conda-linux-gnu-nm
+CONDA_BACKUP_OBJCOPY=/data/align-anything/miniconda3/envs/hantao_proxy/bin/x86_64-conda-linux-gnu-objcopy
+CONDA_BACKUP_OBJDUMP=/data/align-anything/miniconda3/envs/hantao_proxy/bin/x86_64-conda-linux-gnu-objdump
+CONDA_BACKUP_RANLIB=/data/align-anything/miniconda3/envs/hantao_proxy/bin/x86_64-conda-linux-gnu-ranlib
+CONDA_BACKUP_READELF=/data/align-anything/miniconda3/envs/hantao_proxy/bin/x86_64-conda-linux-gnu-readelf
+CONDA_BACKUP_SIZE=/data/align-anything/miniconda3/envs/hantao_proxy/bin/x86_64-conda-linux-gnu-size
+CONDA_BACKUP_STRINGS=/data/align-anything/miniconda3/envs/hantao_proxy/bin/x86_64-conda-linux-gnu-strings
+CONDA_BACKUP_STRIP=/data/align-anything/miniconda3/envs/hantao_proxy/bin/x86_64-conda-linux-gnu-strip
+CONDA_BACKUP__CONDA_PYTHON_SYSCONFIGDATA_NAME=_sysconfigdata_x86_64_conda_cos6_linux_gnu
+CONDA_BACKUP_build_alias=x86_64-conda-linux-gnu
+CONDA_BACKUP_host_alias=x86_64-conda-linux-gnu
+CONDA_BUILD_SYSROOT=/data/align-anything/miniconda3/envs/jy-a/x86_64-conda-linux-gnu/sysroot
+CONDA_DEFAULT_ENV=hantao_stable
+CONDA_EXE=/data/align-anything/miniconda3/bin/conda
+CONDA_PREFIX=/data/align-anything/miniconda3/envs/hantao_stable
+CONDA_PREFIX_1=/home/align-anything/miniconda3
+CONDA_PREFIX_10=/data/align-anything/miniconda3/envs/hantao_proxy
+CONDA_PREFIX_2=/data/align-anything/miniconda3/envs/jy-a
+CONDA_PREFIX_3=/data/align-anything/miniconda3
+CONDA_PREFIX_4=/data/align-anything/miniconda3/envs/hantao_stable
+CONDA_PREFIX_5=/data/align-anything/miniconda3/envs/hantao_cham
+CONDA_PREFIX_6=/data/align-anything/miniconda3/envs/hantao_stable
+CONDA_PREFIX_7=/data/align-anything/miniconda3/envs/hantao_stream
+CONDA_PREFIX_8=/data/align-anything/miniconda3/envs/hantao_proxy
+CONDA_PREFIX_9=/data/align-anything/miniconda3/envs/hantao_stable
+CONDA_PROMPT_MODIFIER=(hantao_stable)
+CONDA_PYTHON_EXE=/data/align-anything/miniconda3/bin/python
+CONDA_ROOT=/home/align-anything/miniconda3
+CONDA_SHLVL=11
+CONDA_TOOLCHAIN_BUILD=x86_64-conda-linux-gnu
+CONDA_TOOLCHAIN_HOST=x86_64-conda-linux-gnu
+CPP=/data/align-anything/miniconda3/envs/jy-a/bin/x86_64-conda-linux-gnu-cpp
+CPPFLAGS=-DNDEBUG -D_FORTIFY_SOURCE=2 -O2 -isystem /data/align-anything/miniconda3/envs/jy-a/include -DNDEBUG -D_FORTIFY_SOURCE=2 -O2 -isystem /data/align-anything/miniconda3/envs/jy-a/include  -I/data/align-anything/miniconda3/envs/jy-a/targets/x86_64-linux/include  -L/data/align-anything/miniconda3/envs/jy-a/targets/x86_64-linux/lib -L/data/align-anything/miniconda3/envs/jy-a/targets/x86_64-linux/lib/stubs
+CROSS_RANK=0
+CROSS_SIZE=1
+CUDA_MODULE_LOADING=LAZY
+CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7
+CXX=/data/align-anything/miniconda3/envs/hantao_stable/bin/g++
+CXXFILT=/data/align-anything/miniconda3/envs/jy-a/bin/x86_64-conda-linux-gnu-c++filt
+CXXFLAGS=-fvisibility-inlines-hidden -fmessage-length=0 -march=nocona -mtune=haswell -ftree-vectorize -fPIC -fstack-protector-strong -fno-plt -O2 -ffunction-sections -pipe -isystem /data/align-anything/miniconda3/envs/jy-a/include -fvisibility-inlines-hidden -fmessage-length=0 -march=nocona -mtune=haswell -ftree-vectorize -fPIC -fstack-protector-strong -fno-plt -O2 -ffunction-sections -pipe -isystem /data/align-anything/miniconda3/envs/jy-a/include  -I/data/align-anything/miniconda3/envs/jy-a/targets/x86_64-linux/include  -L/data/align-anything/miniconda3/envs/jy-a/targets/x86_64-linux/lib -L/data/align-anything/miniconda3/envs/jy-a/targets/x86_64-linux/lib/stubs
+CXX_FOR_BUILD=/data/align-anything/miniconda3/envs/jy-a/bin/x86_64-conda-linux-gnu-c++
+DBUS_SESSION_BUS_ADDRESS=unix:path=/run/user/2000/bus
+DEBUG_CFLAGS=-march=nocona -mtune=haswell -ftree-vectorize -fPIC -fstack-protector-all -fno-plt -Og -g -Wall -Wextra -fvar-tracking-assignments -ffunction-sections -pipe -isystem /data/align-anything/miniconda3/envs/jy-a/include -march=nocona -mtune=haswell -ftree-vectorize -fPIC -fstack-protector-all -fno-plt -Og -g -Wall -Wextra -fvar-tracking-assignments -ffunction-sections -pipe -isystem /data/align-anything/miniconda3/envs/jy-a/include
+DEBUG_CPPFLAGS=-D_DEBUG -D_FORTIFY_SOURCE=2 -Og -isystem /data/align-anything/miniconda3/envs/jy-a/include -D_DEBUG -D_FORTIFY_SOURCE=2 -Og -isystem /data/align-anything/miniconda3/envs/jy-a/include
+DEBUG_CXXFLAGS=-fvisibility-inlines-hidden -fmessage-length=0 -march=nocona -mtune=haswell -ftree-vectorize -fPIC -fstack-protector-all -fno-plt -Og -g -Wall -Wextra -fvar-tracking-assignments -ffunction-sections -pipe -isystem /data/align-anything/miniconda3/envs/jy-a/include -fvisibility-inlines-hidden -fmessage-length=0 -march=nocona -mtune=haswell -ftree-vectorize -fPIC -fstack-protector-all -fno-plt -Og -g -Wall -Wextra -fvar-tracking-assignments -ffunction-sections -pipe -isystem /data/align-anything/miniconda3/envs/jy-a/include
+DWP=/data/align-anything/miniconda3/envs/jy-a/bin/x86_64-conda-linux-gnu-dwp
+ELFEDIT=/data/align-anything/miniconda3/envs/jy-a/bin/x86_64-conda-linux-gnu-elfedit
+GCC=/data/align-anything/miniconda3/envs/jy-a/bin/x86_64-conda-linux-gnu-gcc
+GCC_AR=/data/align-anything/miniconda3/envs/jy-a/bin/x86_64-conda-linux-gnu-gcc-ar
+GCC_NM=/data/align-anything/miniconda3/envs/jy-a/bin/x86_64-conda-linux-gnu-gcc-nm
+GCC_RANLIB=/data/align-anything/miniconda3/envs/jy-a/bin/x86_64-conda-linux-gnu-gcc-ranlib
+GIT_ASKPASS=/home/align-anything/.cursor-server/cli/servers/Stable-51c8aff7cb5a89f4a0e462fbacab938bdbfaf140/server/extensions/git/dist/askpass.sh
+GPROF=/data/align-anything/miniconda3/envs/jy-a/bin/x86_64-conda-linux-gnu-gprof
+GXX=/data/align-anything/miniconda3/envs/jy-a/bin/x86_64-conda-linux-gnu-g++
+HOME=/home/align-anything
+HOST=x86_64-conda-linux-gnu
+LANG=en_US.UTF-8
+LD=/data/align-anything/miniconda3/envs/jy-a/bin/x86_64-conda-linux-gnu-ld
+LDFLAGS=-Wl,-O2 -Wl,--sort-common -Wl,--as-needed -Wl,-z,relro -Wl,-z,now -Wl,--disable-new-dtags -Wl,--gc-sections -Wl,--allow-shlib-undefined -Wl,-rpath,/data/align-anything/miniconda3/envs/jy-a/lib -Wl,-rpath-link,/data/align-anything/miniconda3/envs/jy-a/lib -L/data/align-anything/miniconda3/envs/jy-a/lib -Wl,-O2 -Wl,--sort-common -Wl,--as-needed -Wl,-z,relro -Wl,-z,now -Wl,--disable-new-dtags -Wl,--gc-sections -Wl,--allow-shlib-undefined -Wl,-rpath,/data/align-anything/miniconda3/envs/jy-a/lib -Wl,-rpath-link,/data/align-anything/miniconda3/envs/jy-a/lib -L/data/align-anything/miniconda3/envs/jy-a/lib  -L/data/align-anything/miniconda3/envs/jy-a/targets/x86_64-linux/lib -L/data/align-anything/miniconda3/envs/jy-a/targets/x86_64-linux/lib/stubs
+LD_GOLD=/data/align-anything/miniconda3/envs/jy-a/bin/x86_64-conda-linux-gnu-ld.gold
+LD_LIBRARY_PATH=/data/align-anything/miniconda3/envs/hantao_stable/lib/python3.11/site-packages/cv2/../../lib64:
+LESSCLOSE=/usr/bin/lesspipe %s %s
+LESSOPEN=| /usr/bin/lesspipe %s
+LOCAL_RANK=0
+LOCAL_SIZE=8
+LOGLEVEL=WARNING
+LOGNAME=align-anything
+LS_COLORS=rs=0:di=01;34:ln=01;36:mh=00:pi=40;33:so=01;35:do=01;35:bd=40;33;01:cd=40;33;01:or=40;31;01:mi=00:su=37;41:sg=30;43:ca=30;41:tw=30;42:ow=34;42:st=37;44:ex=01;32:*.tar=01;31:*.tgz=01;31:*.arc=01;31:*.arj=01;31:*.taz=01;31:*.lha=01;31:*.lz4=01;31:*.lzh=01;31:*.lzma=01;31:*.tlz=01;31:*.txz=01;31:*.tzo=01;31:*.t7z=01;31:*.zip=01;31:*.z=01;31:*.dz=01;31:*.gz=01;31:*.lrz=01;31:*.lz=01;31:*.lzo=01;31:*.xz=01;31:*.zst=01;31:*.tzst=01;31:*.bz2=01;31:*.bz=01;31:*.tbz=01;31:*.tbz2=01;31:*.tz=01;31:*.deb=01;31:*.rpm=01;31:*.jar=01;31:*.war=01;31:*.ear=01;31:*.sar=01;31:*.rar=01;31:*.alz=01;31:*.ace=01;31:*.zoo=01;31:*.cpio=01;31:*.7z=01;31:*.rz=01;31:*.cab=01;31:*.wim=01;31:*.swm=01;31:*.dwm=01;31:*.esd=01;31:*.jpg=01;35:*.jpeg=01;35:*.mjpg=01;35:*.mjpeg=01;35:*.gif=01;35:*.bmp=01;35:*.pbm=01;35:*.pgm=01;35:*.ppm=01;35:*.tga=01;35:*.xbm=01;35:*.xpm=01;35:*.tif=01;35:*.tiff=01;35:*.png=01;35:*.svg=01;35:*.svgz=01;35:*.mng=01;35:*.pcx=01;35:*.mov=01;35:*.mpg=01;35:*.mpeg=01;35:*.m2v=01;35:*.mkv=01;35:*.webm=01;35:*.ogm=01;35:*.mp4=01;35:*.m4v=01;35:*.mp4v=01;35:*.vob=01;35:*.qt=01;35:*.nuv=01;35:*.wmv=01;35:*.asf=01;35:*.rm=01;35:*.rmvb=01;35:*.flc=01;35:*.avi=01;35:*.fli=01;35:*.flv=01;35:*.gl=01;35:*.dl=01;35:*.xcf=01;35:*.xwd=01;35:*.yuv=01;35:*.cgm=01;35:*.emf=01;35:*.ogv=01;35:*.ogx=01;35:*.aac=00;36:*.au=00;36:*.flac=00;36:*.m4a=00;36:*.mid=00;36:*.midi=00;36:*.mka=00;36:*.mp3=00;36:*.mpc=00;36:*.ogg=00;36:*.ra=00;36:*.wav=00;36:*.oga=00;36:*.opus=00;36:*.spx=00;36:*.xspf=00;36:
+MASTER_ADDR=127.0.0.1
+MASTER_PORT=14373
+MOTD_SHOWN=pam
+NM=/data/align-anything/miniconda3/envs/jy-a/bin/x86_64-conda-linux-gnu-nm
+NVCC_PREPEND_FLAGS= -ccbin=/data/align-anything/miniconda3/envs/jy-a/bin/x86_64-conda-linux-gnu-c++
+OBJCOPY=/data/align-anything/miniconda3/envs/jy-a/bin/x86_64-conda-linux-gnu-objcopy
+OBJDUMP=/data/align-anything/miniconda3/envs/jy-a/bin/x86_64-conda-linux-gnu-objdump
+OLDPWD=/data/align-anything/hantao/LLaMA-Factory
+PATH=/data/align-anything/miniconda3/envs/hantao_stable/bin:/data/align-anything/miniconda3/envs/hantao_stable/bin:/data/align-anything/miniconda3/bin:/data/align-anything/miniconda3/condabin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games:/snap/bin
+PWD=/data/align-anything/hantao/align-anything/scripts
+PYGAME_HIDE_SUPPORT_PROMPT=1
+PYTHONHASHSEED=42
+PYTHONPATH=/data/align-anything/hantao/align-anything
+QT_QPA_FONTDIR=/data/align-anything/miniconda3/envs/hantao_stable/lib/python3.11/site-packages/cv2/qt/fonts
+QT_QPA_PLATFORM_PLUGIN_PATH=/data/align-anything/miniconda3/envs/hantao_stable/lib/python3.11/site-packages/cv2/qt/plugins
+RANK=0
+RANLIB=/data/align-anything/miniconda3/envs/jy-a/bin/x86_64-conda-linux-gnu-ranlib
+READELF=/data/align-anything/miniconda3/envs/jy-a/bin/x86_64-conda-linux-gnu-readelf
+SHELL=/bin/bash
+SHLVL=3
+SIZE=/data/align-anything/miniconda3/envs/jy-a/bin/x86_64-conda-linux-gnu-size
+SSH_CLIENT=117.136.0.149 36325 30400
+SSH_CONNECTION=111.205.232.251 37945 10.10.212.194 30400
+SSL_CERT_DIR=/usr/lib/ssl/certs
+SSL_CERT_FILE=/usr/lib/ssl/certs/ca-certificates.crt
+STRINGS=/data/align-anything/miniconda3/envs/jy-a/bin/x86_64-conda-linux-gnu-strings
+STRIP=/data/align-anything/miniconda3/envs/jy-a/bin/x86_64-conda-linux-gnu-strip
+TERM=screen
+TERM_PROGRAM=vscode
+TERM_PROGRAM_VERSION=0.41.3
+TMUX=/tmp/tmux-2000/default,34082,51
+TMUX_PANE=%59
+TRITON_CACHE_DIR=/home/align-anything/cache/triton
+USER=align-anything
+VSCODE_GIT_ASKPASS_EXTRA_ARGS=
+VSCODE_GIT_ASKPASS_MAIN=/home/align-anything/.cursor-server/cli/servers/Stable-51c8aff7cb5a89f4a0e462fbacab938bdbfaf140/server/extensions/git/dist/askpass-main.js
+VSCODE_GIT_ASKPASS_NODE=/home/align-anything/.cursor-server/cli/servers/Stable-51c8aff7cb5a89f4a0e462fbacab938bdbfaf140/server/node
+VSCODE_GIT_IPC_HANDLE=/run/user/2000/vscode-git-ef8058c264.sock
+VSCODE_IPC_HOOK_CLI=/run/user/2000/vscode-ipc-db013265-9a8a-4fb7-ba94-00b66d808feb.sock
+WANDB_API_KEY=7e2dcc0c310ebcb7cdcafd5e9320d6be55cf1a33
+WANDB_MODE=online
+WANDB_SERVICE=2-650483-tcp-localhost-34395
+WORLD_SIZE=8
+XDG_DATA_DIRS=/usr/local/share:/usr/share:/var/lib/snapd/desktop
+XDG_RUNTIME_DIR=/run/user/2000
+XDG_SESSION_CLASS=user
+XDG_SESSION_ID=11
+XDG_SESSION_TYPE=tty
+_=/data/align-anything/miniconda3/envs/hantao_stable/bin/deepspeed
+_CE_CONDA=
+_CE_M=
+build_alias=x86_64-conda-linux-gnu
+host_alias=x86_64-conda-linux-gnu

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,28 @@

+{
+  "crop_size": {
+    "height": 512,
+    "width": 512
+  },
+  "do_center_crop": true,
+  "do_convert_rgb": true,
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "image_mean": [
+    1.0,
+    1.0,
+    1.0
+  ],
+  "image_processor_type": "ChameleonImageProcessor",
+  "image_std": [
+    1.0,
+    1.0,
+    1.0
+  ],
+  "processor_class": "ChameleonProcessor",
+  "resample": 1,
+  "rescale_factor": 0.0078,
+  "size": {
+    "shortest_edge": 512
+  }
+}

processor_config.json ADDED Viewed

	@@ -0,0 +1,5 @@

+{
+  "image_seq_length": 1024,
+  "image_token": "<image>",
+  "processor_class": "ChameleonProcessor"
+}

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a5029034ff3e67f17bc3721362121885c6ce954d0df00e82bc982d91ef3c507f
+size 14086364170

script.sh ADDED Viewed

	@@ -0,0 +1,84 @@

+#!/usr/bin/env bash
+#
+# Copyright 2024 PKU-Alignment Team. All Rights Reserved.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+# ==============================================================================
+export CC=/data/align-anything/miniconda3/envs/hantao_stable/bin/gcc
+export CXX=/data/align-anything/miniconda3/envs/hantao_stable/bin/g++
+export TRITON_CACHE_DIR="/home/align-anything/cache/triton"
+export WANDB_API_KEY="7e2dcc0c310ebcb7cdcafd5e9320d6be55cf1a33"
+export WANDB_MODE=online
+MODEL_NAME_OR_PATH="/data/align-anything/hantao/models/chameleon-7b"
+DATASET_PATH=(
+    "/data/align-anything/hantao/data/mm_interp/AA_preference_cocour_new_step10/tokenized"
+    "/data/align-anything/hantao/data/mm_interp/AA_preference_cosi_new_step10/tokenized"
+    "/data/align-anything/hantao/data/mm_interp/AA_preference_l0_new_step10/tokenized"
+    "/data/align-anything/hantao/data/mm_interp/AA_preference_random/tokenized"
+)
+DATASET_NAME=(
+    "q0_10_preference"
+    "q0_20_preference"
+    "q0_30_preference"
+    "q0_40_preference"
+    "q0_50_preference"
+    "q0_60_preference"
+    "q0_70_preference"
+    "q0_80_preference"
+    "q0_90_preference"
+)
+OUTPUT_PATH="/data/align-anything/hantao/align-anything/outputs/mm_interp"
+mkdir -p $OUTPUT_PATH
+# Initialize variables
+for dataset_path in ${DATASET_PATH[@]}; do
+    for dataset_name in ${DATASET_NAME[@]}; do
+        TRAIN_DATASETS=$dataset_path
+        # dataset middle name
+        middle_name= echo "$dataset_path" | awk -F'/' '{print $(NF-1)}'
+        OUTPUT_DIR=$OUTPUT_PATH/$middle_name/$dataset_name
+        mkdir -p $OUTPUT_DIR
+        echo "Training on $TRAIN_DATASETS, output to $OUTPUT_DIR"
+        # Source the setup script
+        source ./setup.sh
+        # Execute deepspeed command
+        deepspeed \
+            --master_port ${MASTER_PORT} \
+            --module align_anything.trainers.text_image_to_text_image.dpo \
+            --model_name_or_path ${MODEL_NAME_OR_PATH} \
+            --train_datasets ${TRAIN_DATASETS} \
+            --output_dir ${OUTPUT_DIR} \
+            --per_device_train_batch_size 4 \
+            --per_device_eval_batch_size 4 \
+            --gradient_accumulation_steps 2 \
+            --train_template Chameleon_preference \
+            --train_split train \
+            --train_data_files ${dataset_name}.pt \
+            --learning_rate 1e-6 \
+            --epochs 3 \
+            --lr_scheduler_type cosine \
+            --save_interval 400
+        bash /data/align-anything/hantao/align-anything/outputs/cut.sh $OUTPUT_DIR
+    done
+done

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,37 @@

+{
+  "bos_token": {
+    "content": "<s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "</s>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "<pad>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": {
+    "content": "<reserved08706>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "<unk>",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

The diff for this file is too large to render. See raw diff

wandb/debug-internal.log ADDED Viewed

	@@ -0,0 +1,20 @@

+{"time":"2025-01-01T03:22:25.755777689Z","level":"INFO","msg":"using version","core version":"0.18.3"}
+{"time":"2025-01-01T03:22:25.755807853Z","level":"INFO","msg":"created symlink","path":"/data/align-anything/hantao/align-anything/outputs/mm_interp/q0_10_preference/wandb/run-20250101_032225-2bzz3n13/logs/debug-core.log"}
+{"time":"2025-01-01T03:22:25.758235027Z","level":"ERROR","msg":"dialing: google: could not find default credentials. See https://cloud.google.com/docs/authentication/external/set-up-adc for more information"}
+{"time":"2025-01-01T03:22:25.778926827Z","level":"INFO","msg":"created new stream","id":"2bzz3n13"}
+{"time":"2025-01-01T03:22:25.778989066Z","level":"INFO","msg":"stream: started","id":"2bzz3n13"}
+{"time":"2025-01-01T03:22:25.779016519Z","level":"INFO","msg":"writer: Do: started","stream_id":{"value":"2bzz3n13"}}
+{"time":"2025-01-01T03:22:25.779052686Z","level":"INFO","msg":"sender: started","stream_id":{"value":"2bzz3n13"}}
+{"time":"2025-01-01T03:22:25.779034819Z","level":"INFO","msg":"handler: started","stream_id":{"value":"2bzz3n13"}}
+{"time":"2025-01-01T03:22:26.392432178Z","level":"INFO","msg":"wandb-core","!BADKEY":null}
+{"time":"2025-01-01T03:22:26.39641254Z","level":"INFO","msg":"Starting system monitor"}
+{"time":"2025-01-01T04:18:12.751361379Z","level":"INFO","msg":"Stopping system monitor"}
+{"time":"2025-01-01T04:18:12.776637037Z","level":"INFO","msg":"Stopped system monitor"}
+{"time":"2025-01-01T04:18:13.326901072Z","level":"WARN","msg":"No program path found, not creating job artifact. See https://docs.wandb.ai/guides/launch/create-job"}
+{"time":"2025-01-01T04:18:13.326920848Z","level":"INFO","msg":"sender: sendDefer: no job artifact to save"}
+{"time":"2025-01-01T04:18:14.470754716Z","level":"INFO","msg":"fileTransfer: Close: file transfer manager closed"}
+{"time":"2025-01-01T04:18:16.234531428Z","level":"INFO","msg":"stream: closing","id":"2bzz3n13"}
+{"time":"2025-01-01T04:18:16.234542406Z","level":"INFO","msg":"handler: closed","stream_id":{"value":"2bzz3n13"}}
+{"time":"2025-01-01T04:18:16.234551344Z","level":"INFO","msg":"writer: Close: closed","stream_id":{"value":"2bzz3n13"}}
+{"time":"2025-01-01T04:18:16.23457812Z","level":"INFO","msg":"sender: closed","stream_id":{"value":"2bzz3n13"}}
+{"time":"2025-01-01T04:18:16.236373925Z","level":"INFO","msg":"stream: closed","id":"2bzz3n13"}

wandb/debug.log ADDED Viewed

	@@ -0,0 +1,33 @@

+2025-01-01 03:22:25,741 INFO    MainThread:650483 [wandb_setup.py:_flush():79] Current SDK version is 0.18.3
+2025-01-01 03:22:25,742 INFO    MainThread:650483 [wandb_setup.py:_flush():79] Configure stats pid to 650483
+2025-01-01 03:22:25,742 INFO    MainThread:650483 [wandb_setup.py:_flush():79] Loading settings from /home/align-anything/.config/wandb/settings
+2025-01-01 03:22:25,742 INFO    MainThread:650483 [wandb_setup.py:_flush():79] Loading settings from /data/align-anything/hantao/align-anything/scripts/wandb/settings
+2025-01-01 03:22:25,742 INFO    MainThread:650483 [wandb_setup.py:_flush():79] Loading settings from environment variables: {'api_key': '***REDACTED***', 'mode': 'online'}
+2025-01-01 03:22:25,742 INFO    MainThread:650483 [wandb_setup.py:_flush():79] Applying setup settings: {'mode': 'online', '_disable_service': None}
+2025-01-01 03:22:25,742 WARNING MainThread:650483 [wandb_setup.py:_flush():79] Could not find program at -m align_anything.trainers.text_image_to_text_image.dpo
+2025-01-01 03:22:25,742 INFO    MainThread:650483 [wandb_setup.py:_flush():79] Inferring run settings from compute environment: {'program_relpath': None, 'program': '-m align_anything.trainers.text_image_to_text_image.dpo'}
+2025-01-01 03:22:25,742 INFO    MainThread:650483 [wandb_setup.py:_flush():79] Applying login settings: {}
+2025-01-01 03:22:25,742 INFO    MainThread:650483 [wandb_init.py:_log_setup():532] Logging user logs to /data/align-anything/hantao/align-anything/outputs/mm_interp//q0_10_preference/wandb/run-20250101_032225-2bzz3n13/logs/debug.log
+2025-01-01 03:22:25,742 INFO    MainThread:650483 [wandb_init.py:_log_setup():533] Logging internal logs to /data/align-anything/hantao/align-anything/outputs/mm_interp//q0_10_preference/wandb/run-20250101_032225-2bzz3n13/logs/debug-internal.log
+2025-01-01 03:22:25,742 INFO    MainThread:650483 [wandb_init.py:init():617] calling init triggers
+2025-01-01 03:22:25,742 INFO    MainThread:650483 [wandb_init.py:init():624] wandb.init called with sweep_config: {}
+config: {'train_cfgs': {'ds_cfgs': 'ds_z3_config.json', 'epochs': 3.0, 'seed': 42, 'per_device_train_batch_size': 4.0, 'per_device_eval_batch_size': 4.0, 'gradient_accumulation_steps': 2.0, 'gradient_checkpointing': True, 'learning_rate': 1e-06, 'lr_scheduler_type': 'cosine', 'lr_warmup_ratio': 0.03, 'weight_decay': 0.01, 'adam_betas': [0.9, 0.95], 'bf16': True, 'fp16': False, 'eval_strategy': 'epoch', 'eval_interval': 10, 'regularization': 0.001, 'scale_coeff': 0.1, 'freeze_mm_proj': True, 'freeze_vision_tower': False, 'freeze_language_model': True}, 'data_cfgs': {'train_datasets': '/data/align-anything/hantao/data/mm_interp/AA_preference_cocour_new_step10/tokenized', 'train_template': 'Chameleon_preference', 'train_size': None, 'train_split': 'train', 'train_subset': None, 'train_data_files': 'q0_10_preference.pt', 'train_optional_args': [], 'eval_datasets': None, 'eval_template': None, 'eval_size': None, 'eval_split': None, 'eval_subset': None, 'eval_data_files': None, 'eval_optional_args': []}, 'logger_cfgs': {'log_type': 'wandb', 'log_project': 'align-anything', 'log_run_name': 'dpo', 'output_dir': '/data/align-anything/hantao/align-anything/outputs/mm_interp//q0_10_preference', 'cache_dir': None, 'save_interval': 400.0}, 'model_cfgs': {'model_name_or_path': '/data/align-anything/hantao/models/chameleon-7b', 'trust_remote_code': True, 'model_max_length': 4096}, 'special_tokens': None}
+2025-01-01 03:22:25,742 INFO    MainThread:650483 [wandb_init.py:init():667] starting backend
+2025-01-01 03:22:25,742 INFO    MainThread:650483 [wandb_init.py:init():671] sending inform_init request
+2025-01-01 03:22:25,748 INFO    MainThread:650483 [backend.py:_multiprocessing_setup():104] multiprocessing start_methods=fork,spawn,forkserver, using: spawn
+2025-01-01 03:22:25,748 INFO    MainThread:650483 [wandb_init.py:init():684] backend started and connected
+2025-01-01 03:22:25,758 INFO    MainThread:650483 [wandb_init.py:init():779] updated telemetry
+2025-01-01 03:22:25,803 INFO    MainThread:650483 [wandb_init.py:init():812] communicating run to backend with 90.0 second timeout
+2025-01-01 03:22:26,388 INFO    MainThread:650483 [wandb_init.py:init():863] starting run threads in backend
+2025-01-01 03:22:26,708 INFO    MainThread:650483 [wandb_run.py:_console_start():2465] atexit reg
+2025-01-01 03:22:26,708 INFO    MainThread:650483 [wandb_run.py:_redirect():2313] redirect: wrap_raw
+2025-01-01 03:22:26,708 INFO    MainThread:650483 [wandb_run.py:_redirect():2378] Wrapping output streams.
+2025-01-01 03:22:26,708 INFO    MainThread:650483 [wandb_run.py:_redirect():2403] Redirects installed.
+2025-01-01 03:22:26,713 INFO    MainThread:650483 [wandb_init.py:init():907] run started, returning control to user process
+2025-01-01 04:18:12,748 INFO    MainThread:650483 [wandb_run.py:_finish():2164] finishing run htlou/align-anything/2bzz3n13
+2025-01-01 04:18:12,750 INFO    MainThread:650483 [wandb_run.py:_atexit_cleanup():2428] got exitcode: 0
+2025-01-01 04:18:12,750 INFO    MainThread:650483 [wandb_run.py:_restore():2410] restore
+2025-01-01 04:18:12,750 INFO    MainThread:650483 [wandb_run.py:_restore():2416] restore done
+2025-01-01 04:18:16,219 INFO    MainThread:650483 [wandb_run.py:_footer_history_summary_info():4049] rendering history
+2025-01-01 04:18:16,221 INFO    MainThread:650483 [wandb_run.py:_footer_history_summary_info():4081] rendering summary
+2025-01-01 04:18:16,232 INFO    MainThread:650483 [wandb_run.py:_footer_sync_info():4008] logging synced files

wandb/run-20250101_031915-9dphq5gk/files/output.log ADDED Viewed

	@@ -0,0 +1,2 @@


1	+ *** Running training ***
2	+ Training 1/3.0 epoch: 0%\| \| 0/180.0 [00:00<?, ?it/s]`use_cache=True` is incompatible with gradient checkpointing. Setting `use_cache=False`.

wandb/run-20250101_031915-9dphq5gk/files/requirements.txt ADDED Viewed

	@@ -0,0 +1,248 @@

+align-anything==0.0.1.dev0
+gitdb==4.0.11
+wcwidth==0.2.13
+identify==2.6.1
+tomlkit==0.12.0
+bitsandbytes==0.44.1
+trl==0.9.6
+pytest-split==0.8.0
+gradio==4.44.1
+pip==24.2
+multidict==6.1.0
+fairscale==0.4.13
+mistral_common==1.4.4
+python-dotenv==1.0.1
+uvloop==0.20.0
+absl-py==2.1.0
+tiktoken==0.7.0
+pydub==0.25.1
+websockets==12.0
+llamafactory==0.9.1.dev0
+triton==3.0.0
+tifffile==2024.9.20
+safe-rlhf==0.0.1.dev0
+pandas==2.2.3
+grpcio==1.66.2
+click==8.1.7
+ninja==1.11.1.1
+rich==13.9.2
+Jinja2==3.1.4
+Pygments==2.18.0
+nvidia-cudnn-cu12==9.1.0.70
+importlib_resources==6.4.5
+GitPython==3.1.43
+nvidia-cufft-cu12==11.0.2.54
+tensorboard-data-server==0.7.2
+align-anything==0.0.1.dev0
+six==1.16.0
+scipy==1.14.1
+mpmath==1.3.0
+jsonschema-specifications==2024.10.1
+scikit-image==0.24.0
+zipp==3.20.2
+cycler==0.12.1
+MarkupSafe==2.1.5
+tzdata==2024.2
+idna==3.10
+pycountry==24.6.1
+nvidia-nccl-cu12==2.20.5
+matplotlib==3.9.2
+pytz==2024.2
+uvicorn==0.31.1
+dill==0.3.8
+pyparsing==3.1.4
+pytest==7.2.0
+jiter==0.6.1
+safetensors==0.4.5
+typing_extensions==4.12.2
+decorator==4.4.2
+typeguard==4.4.1
+prometheus_client==0.21.0
+nvidia-cuda-cupti-cu12==12.1.105
+sentencepiece==0.2.0
+requests==2.32.3
+kiwisolver==1.4.7
+gdown==5.2.0
+multiprocess==0.70.16
+xxhash==3.5.0
+PyYAML==6.0.2
+gguf==0.10.0
+nvidia-nvtx-cu12==12.1.105
+hpsv2==1.2.0
+tensorboard==2.18.0
+nodeenv==1.9.1
+filelock==3.16.1
+distro==1.9.0
+scikit-learn==1.5.2
+huggingface-hub==0.25.2
+pyairports==2.1.1
+importlib_metadata==8.5.0
+pyarrow==17.0.0
+llvmlite==0.43.0
+ray==2.37.0
+tokenizers==0.20.3
+nvidia-nvjitlink-cu12==12.6.77
+av==14.0.1
+deepspeed==0.15.2
+clip==0.2.0
+shtab==1.7.1
+certifi==2024.8.30
+braceexpand==0.1.7
+nvidia-ml-py==12.560.30
+webdataset==0.2.100
+docker-pycreds==0.4.0
+einops==0.8.0
+iniconfig==2.0.0
+tyro==0.9.2
+torchvision==0.19.0
+accelerate==0.34.2
+beautifulsoup4==4.12.3
+pyzmq==26.2.0
+pycparser==2.22
+nvidia-curand-cu12==10.3.2.106
+msgpack==1.1.0
+soxr==0.5.0.post1
+platformdirs==4.3.6
+h11==0.14.0
+psutil==6.0.0
+pydantic==2.9.2
+shellingham==1.5.4
+imageio-ffmpeg==0.5.1
+wandb==0.18.3
+audioread==3.0.1
+annotated-types==0.7.0
+docstring_parser==0.16
+cloudpickle==3.1.0
+regex==2024.9.11
+packaging==24.1
+timm==0.6.13
+aiosignal==1.3.1
+numba==0.60.0
+orjson==3.10.7
+rpds-py==0.20.0
+virtualenv==20.26.6
+joblib==1.4.2
+charset-normalizer==3.4.0
+httpx==0.27.2
+ffmpy==0.4.0
+lm-format-enforcer==0.10.6
+yt-dlp==2024.8.6
+sympy==1.13.3
+python-dateutil==2.9.0.post0
+nvidia-cusolver-cu12==11.4.5.107
+msgspec==0.18.6
+mdurl==0.1.2
+torch==2.4.0
+fastapi==0.115.0
+optree==0.13.0
+PySocks==1.7.1
+transformers==4.46.0.dev0
+torchlibrosa==0.1.0
+fsspec==2024.6.1
+nvidia-cublas-cu12==12.1.3.1
+gradio_client==1.3.0
+args==0.1.0
+cffi==1.17.1
+fonttools==4.54.1
+clint==0.5.1
+lark==1.2.2
+tqdm==4.66.5
+semantic-version==2.10.0
+pooch==1.8.2
+markdown-it-py==3.0.0
+pydantic_core==2.23.4
+sniffio==1.3.1
+httptools==0.6.1
+nvidia-cuda-runtime-cu12==12.1.105
+anyio==4.6.0
+ftfy==6.3.0
+Markdown==3.7
+datasets==2.21.0
+diffusers==0.30.3
+nvidia-cuda-nvrtc-cu12==12.1.105
+vllm==0.6.2
+starlette==0.38.6
+flash-attn==2.7.0.post2
+urllib3==2.2.3
+Werkzeug==3.0.4
+py-cpuinfo==9.0.0
+moviepy==1.0.3
+librosa==0.10.2.post1
+peft==0.12.0
+soupsieve==2.6
+lazy_loader==0.4
+pluggy==1.5.0
+setuptools==75.1.0
+sentry-sdk==2.16.0
+tabulate==0.9.0
+transformers==4.45.2
+pre_commit==4.0.1
+termcolor==2.5.0
+frechet-audio-distance==0.1.2
+pytorch-fid==0.3.0
+setproctitle==1.3.3
+jsonschema==4.23.0
+aiofiles==23.2.1
+contourpy==1.3.0
+distlib==0.3.9
+interegular==0.3.3
+fire==0.7.0
+diskcache==5.6.3
+proglog==0.1.10
+soundfile==0.12.1
+protobuf==3.20.3
+smmap==5.0.1
+pycryptodomex==3.21.0
+Brotli==1.1.0
+pillow==10.4.0
+frozenlist==1.4.1
+numpy==1.26.4
+mutagen==1.47.0
+outlines==0.0.46
+attrs==24.2.0
+torchaudio==2.4.0
+aiohttp==3.10.10
+ruff==0.6.9
+watchfiles==0.24.0
+threadpoolctl==3.5.0
+nest-asyncio==1.6.0
+partial-json-parser==0.2.1.1.post4
+sse-starlette==2.1.3
+shortuuid==1.0.13
+typer==0.12.5
+prometheus-fastapi-instrumentator==7.0.0
+imageio==2.35.1
+wheel==0.44.0
+image-reward==1.5
+networkx==3.4.1
+propcache==0.2.0
+aiohappyeyeballs==2.4.3
+nvidia-cusparse-cu12==12.1.0.106
+xformers==0.0.27.post2
+cfgv==3.4.0
+python-multipart==0.0.12
+httpcore==1.0.6
+opencv-python==4.6.0.66
+resampy==0.4.3
+yarl==1.15.0
+referencing==0.35.1
+openai==1.51.2
+hjson==3.1.0
+llamafactory==0.9.1.dev0
+jaraco.collections==5.1.0
+backports.tarfile==1.2.0
+more-itertools==10.3.0
+wheel==0.43.0
+importlib_metadata==8.0.0
+zipp==3.19.2
+autocommand==2.2.2
+jaraco.functools==4.0.1
+platformdirs==4.2.2
+tomli==2.0.1
+jaraco.text==3.12.1
+typing_extensions==4.12.2
+jaraco.context==5.3.0
+importlib_resources==6.4.0
+packaging==24.1
+inflect==7.3.1
+typeguard==4.3.0

wandb/run-20250101_031915-9dphq5gk/files/wandb-metadata.json ADDED Viewed

	@@ -0,0 +1,112 @@

+{
+  "os":  "Linux-5.4.0-196-generic-x86_64-with-glibc2.31",
+  "python":  "3.11.10",
+  "startedAt":  "2025-01-01T03:19:15.936404Z",
+  "args":  [
+    "--local_rank=0",
+    "--model_name_or_path",
+    "/data/align-anything/hantao/models/chameleon-7b",
+    "--train_datasets",
+    "/data/align-anything/hantao/data/mm_interp/AA_preference_cocour_new_step10/tokenized",
+    "--output_dir",
+    "/data/align-anything/hantao/align-anything/outputs/mm_interp//q0_10_preference",
+    "--per_device_train_batch_size",
+    "8",
+    "--per_device_eval_batch_size",
+    "8",
+    "--gradient_accumulation_steps",
+    "4",
+    "--train_template",
+    "Chameleon_preference",
+    "--train_split",
+    "train",
+    "--train_data_files",
+    "q0_10_preference.pt",
+    "--learning_rate",
+    "1e-6",
+    "--epochs",
+    "3",
+    "--lr_scheduler_type",
+    "cosine",
+    "--save_interval",
+    "400"
+  ],
+  "program":  "-m align_anything.trainers.text_image_to_text_image.dpo",
+  "git":  {
+    "remote":  "https://github.com/PKU-Alignment/align-anything.git",
+    "commit":  "6fde660afc9985323f147930eedf188a5699adc7"
+  },
+  "email":  "[email protected]",
+  "root":  "/data/align-anything/hantao/align-anything/outputs/mm_interp//q0_10_preference",
+  "host":  "lyg0194",
+  "username":  "align-anything",
+  "executable":  "/data/align-anything/miniconda3/envs/hantao_stable/bin/python",
+  "cpu_count":  64,
+  "cpu_count_logical":  128,
+  "gpu":  "[NVIDIA A100-SXM4-80GB, NVIDIA A100-SXM4-80GB, NVIDIA A100-SXM4-80GB, NVIDIA A100-SXM4-80GB, NVIDIA A100-SXM4-80GB, NVIDIA A100-SXM4-80GB, NVIDIA A100-SXM4-80GB, NVIDIA A100-SXM4-80GB]",
+  "gpu_count":  8,
+  "disk":  {
+    "/":  {
+      "total":  "939477946368",
+      "used":  "596692971520"
+    }
+  },
+  "memory":  {
+    "total":  "1081823907840"
+  },
+  "cpu":  {
+    "count":  64,
+    "countLogical":  128
+  },
+  "gpu_nvidia":  [
+    {
+      "name":  "NVIDIA A100-SXM4-80GB",
+      "memoryTotal":  "85899345920",
+      "cudaCores":  6912,
+      "architecture":  "Ampere"
+    },
+    {
+      "name":  "NVIDIA A100-SXM4-80GB",
+      "memoryTotal":  "85899345920",
+      "cudaCores":  6912,
+      "architecture":  "Ampere"
+    },
+    {
+      "name":  "NVIDIA A100-SXM4-80GB",
+      "memoryTotal":  "85899345920",
+      "cudaCores":  6912,
+      "architecture":  "Ampere"
+    },
+    {
+      "name":  "NVIDIA A100-SXM4-80GB",
+      "memoryTotal":  "85899345920",
+      "cudaCores":  6912,
+      "architecture":  "Ampere"
+    },
+    {
+      "name":  "NVIDIA A100-SXM4-80GB",
+      "memoryTotal":  "85899345920",
+      "cudaCores":  6912,
+      "architecture":  "Ampere"
+    },
+    {
+      "name":  "NVIDIA A100-SXM4-80GB",
+      "memoryTotal":  "85899345920",
+      "cudaCores":  6912,
+      "architecture":  "Ampere"
+    },
+    {
+      "name":  "NVIDIA A100-SXM4-80GB",
+      "memoryTotal":  "85899345920",
+      "cudaCores":  6912,
+      "architecture":  "Ampere"
+    },
+    {
+      "name":  "NVIDIA A100-SXM4-80GB",
+      "memoryTotal":  "85899345920",
+      "cudaCores":  6912,
+      "architecture":  "Ampere"
+    }
+  ],
+  "cudaVersion":  "12.4"
+}

wandb/run-20250101_031915-9dphq5gk/logs/debug-internal.log ADDED Viewed

	@@ -0,0 +1,10 @@

+{"time":"2025-01-01T03:19:15.945723272Z","level":"INFO","msg":"using version","core version":"0.18.3"}
+{"time":"2025-01-01T03:19:15.945753959Z","level":"INFO","msg":"created symlink","path":"/data/align-anything/hantao/align-anything/outputs/mm_interp/q0_10_preference/wandb/run-20250101_031915-9dphq5gk/logs/debug-core.log"}
+{"time":"2025-01-01T03:19:15.949438002Z","level":"ERROR","msg":"dialing: google: could not find default credentials. See https://cloud.google.com/docs/authentication/external/set-up-adc for more information"}
+{"time":"2025-01-01T03:19:15.976027597Z","level":"INFO","msg":"created new stream","id":"9dphq5gk"}
+{"time":"2025-01-01T03:19:15.976056272Z","level":"INFO","msg":"stream: started","id":"9dphq5gk"}
+{"time":"2025-01-01T03:19:15.976078609Z","level":"INFO","msg":"sender: started","stream_id":{"value":"9dphq5gk"}}
+{"time":"2025-01-01T03:19:15.976082856Z","level":"INFO","msg":"handler: started","stream_id":{"value":"9dphq5gk"}}
+{"time":"2025-01-01T03:19:15.976077521Z","level":"INFO","msg":"writer: Do: started","stream_id":{"value":"9dphq5gk"}}
+{"time":"2025-01-01T03:19:16.581967595Z","level":"INFO","msg":"wandb-core","!BADKEY":null}
+{"time":"2025-01-01T03:19:16.586131154Z","level":"INFO","msg":"Starting system monitor"}

wandb/run-20250101_031915-9dphq5gk/logs/debug.log ADDED Viewed

	@@ -0,0 +1,26 @@

+2025-01-01 03:19:15,933 INFO    MainThread:646328 [wandb_setup.py:_flush():79] Current SDK version is 0.18.3
+2025-01-01 03:19:15,933 INFO    MainThread:646328 [wandb_setup.py:_flush():79] Configure stats pid to 646328
+2025-01-01 03:19:15,933 INFO    MainThread:646328 [wandb_setup.py:_flush():79] Loading settings from /home/align-anything/.config/wandb/settings
+2025-01-01 03:19:15,933 INFO    MainThread:646328 [wandb_setup.py:_flush():79] Loading settings from /data/align-anything/hantao/align-anything/scripts/wandb/settings
+2025-01-01 03:19:15,933 INFO    MainThread:646328 [wandb_setup.py:_flush():79] Loading settings from environment variables: {'api_key': '***REDACTED***', 'mode': 'online'}
+2025-01-01 03:19:15,933 INFO    MainThread:646328 [wandb_setup.py:_flush():79] Applying setup settings: {'mode': 'online', '_disable_service': None}
+2025-01-01 03:19:15,933 WARNING MainThread:646328 [wandb_setup.py:_flush():79] Could not find program at -m align_anything.trainers.text_image_to_text_image.dpo
+2025-01-01 03:19:15,933 INFO    MainThread:646328 [wandb_setup.py:_flush():79] Inferring run settings from compute environment: {'program_relpath': None, 'program': '-m align_anything.trainers.text_image_to_text_image.dpo'}
+2025-01-01 03:19:15,933 INFO    MainThread:646328 [wandb_setup.py:_flush():79] Applying login settings: {}
+2025-01-01 03:19:15,933 INFO    MainThread:646328 [wandb_init.py:_log_setup():532] Logging user logs to /data/align-anything/hantao/align-anything/outputs/mm_interp//q0_10_preference/wandb/run-20250101_031915-9dphq5gk/logs/debug.log
+2025-01-01 03:19:15,933 INFO    MainThread:646328 [wandb_init.py:_log_setup():533] Logging internal logs to /data/align-anything/hantao/align-anything/outputs/mm_interp//q0_10_preference/wandb/run-20250101_031915-9dphq5gk/logs/debug-internal.log
+2025-01-01 03:19:15,933 INFO    MainThread:646328 [wandb_init.py:init():617] calling init triggers
+2025-01-01 03:19:15,933 INFO    MainThread:646328 [wandb_init.py:init():624] wandb.init called with sweep_config: {}
+config: {'train_cfgs': {'ds_cfgs': 'ds_z3_config.json', 'epochs': 3.0, 'seed': 42, 'per_device_train_batch_size': 8.0, 'per_device_eval_batch_size': 8.0, 'gradient_accumulation_steps': 4.0, 'gradient_checkpointing': True, 'learning_rate': 1e-06, 'lr_scheduler_type': 'cosine', 'lr_warmup_ratio': 0.03, 'weight_decay': 0.01, 'adam_betas': [0.9, 0.95], 'bf16': True, 'fp16': False, 'eval_strategy': 'epoch', 'eval_interval': 10, 'regularization': 0.001, 'scale_coeff': 0.1, 'freeze_mm_proj': True, 'freeze_vision_tower': False, 'freeze_language_model': True}, 'data_cfgs': {'train_datasets': '/data/align-anything/hantao/data/mm_interp/AA_preference_cocour_new_step10/tokenized', 'train_template': 'Chameleon_preference', 'train_size': None, 'train_split': 'train', 'train_subset': None, 'train_data_files': 'q0_10_preference.pt', 'train_optional_args': [], 'eval_datasets': None, 'eval_template': None, 'eval_size': None, 'eval_split': None, 'eval_subset': None, 'eval_data_files': None, 'eval_optional_args': []}, 'logger_cfgs': {'log_type': 'wandb', 'log_project': 'align-anything', 'log_run_name': 'dpo', 'output_dir': '/data/align-anything/hantao/align-anything/outputs/mm_interp//q0_10_preference', 'cache_dir': None, 'save_interval': 400.0}, 'model_cfgs': {'model_name_or_path': '/data/align-anything/hantao/models/chameleon-7b', 'trust_remote_code': True, 'model_max_length': 4096}, 'special_tokens': None}
+2025-01-01 03:19:15,933 INFO    MainThread:646328 [wandb_init.py:init():667] starting backend
+2025-01-01 03:19:15,933 INFO    MainThread:646328 [wandb_init.py:init():671] sending inform_init request
+2025-01-01 03:19:15,935 INFO    MainThread:646328 [backend.py:_multiprocessing_setup():104] multiprocessing start_methods=fork,spawn,forkserver, using: spawn
+2025-01-01 03:19:15,936 INFO    MainThread:646328 [wandb_init.py:init():684] backend started and connected
+2025-01-01 03:19:15,938 INFO    MainThread:646328 [wandb_init.py:init():779] updated telemetry
+2025-01-01 03:19:15,998 INFO    MainThread:646328 [wandb_init.py:init():812] communicating run to backend with 90.0 second timeout
+2025-01-01 03:19:16,578 INFO    MainThread:646328 [wandb_init.py:init():863] starting run threads in backend
+2025-01-01 03:19:17,193 INFO    MainThread:646328 [wandb_run.py:_console_start():2465] atexit reg
+2025-01-01 03:19:17,193 INFO    MainThread:646328 [wandb_run.py:_redirect():2313] redirect: wrap_raw
+2025-01-01 03:19:17,193 INFO    MainThread:646328 [wandb_run.py:_redirect():2378] Wrapping output streams.
+2025-01-01 03:19:17,193 INFO    MainThread:646328 [wandb_run.py:_redirect():2403] Redirects installed.
+2025-01-01 03:19:17,199 INFO    MainThread:646328 [wandb_init.py:init():907] run started, returning control to user process

wandb/run-20250101_031915-9dphq5gk/run-9dphq5gk.wandb ADDED Viewed

File without changes

wandb/run-20250101_032225-2bzz3n13/files/config.yaml ADDED Viewed

	@@ -0,0 +1,98 @@

+_wandb:
+    value:
+        cli_version: 0.18.3
+        m: []
+        python_version: 3.11.10
+        t:
+            "1":
+                - 1
+                - 11
+                - 41
+                - 49
+                - 51
+                - 55
+                - 71
+                - 83
+                - 98
+                - 105
+            "2":
+                - 1
+                - 11
+                - 41
+                - 49
+                - 51
+                - 55
+                - 71
+                - 83
+                - 98
+                - 105
+            "3":
+                - 2
+                - 13
+                - 16
+                - 23
+                - 55
+                - 61
+            "4": 3.11.10
+            "5": 0.18.3
+            "6": 4.45.2
+            "8":
+                - 5
+            "12": 0.18.3
+            "13": linux-x86_64
+data_cfgs:
+    value:
+        eval_data_files: null
+        eval_datasets: null
+        eval_optional_args: []
+        eval_size: null
+        eval_split: null
+        eval_subset: null
+        eval_template: null
+        train_data_files: q0_10_preference.pt
+        train_datasets: /data/align-anything/hantao/data/mm_interp/AA_preference_cocour_new_step10/tokenized
+        train_optional_args: []
+        train_size: null
+        train_split: train
+        train_subset: null
+        train_template: Chameleon_preference
+logger_cfgs:
+    value:
+        cache_dir: null
+        log_project: align-anything
+        log_run_name: dpo
+        log_type: wandb
+        output_dir: /data/align-anything/hantao/align-anything/outputs/mm_interp//q0_10_preference
+        save_interval: 400
+model_cfgs:
+    value:
+        model_max_length: 4096
+        model_name_or_path: /data/align-anything/hantao/models/chameleon-7b
+        trust_remote_code: true
+special_tokens:
+    value: null
+train_cfgs:
+    value:
+        adam_betas:
+            - 0.9
+            - 0.95
+        bf16: true
+        ds_cfgs: ds_z3_config.json
+        epochs: 3
+        eval_interval: 10
+        eval_strategy: epoch
+        fp16: false
+        freeze_language_model: true
+        freeze_mm_proj: true
+        freeze_vision_tower: false
+        gradient_accumulation_steps: 2
+        gradient_checkpointing: true
+        learning_rate: 1e-06
+        lr_scheduler_type: cosine
+        lr_warmup_ratio: 0.03
+        per_device_eval_batch_size: 4
+        per_device_train_batch_size: 4
+        regularization: 0.001
+        scale_coeff: 0.1
+        seed: 42
+        weight_decay: 0.01

wandb/run-20250101_032225-2bzz3n13/files/output.log ADDED Viewed

	@@ -0,0 +1,47 @@

+***** Running training *****
+Training 1/3.0 epoch:   0%|                                                                                                                                                                                                                                                                             | 0/357.0 [00:00<?, ?it/s]`use_cache=True` is incompatible with gradient checkpointing. Setting `use_cache=False`.
+Training 3/3.0 epoch (loss 0.0012): 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 357/357.0 [54:49<00:00,  9.21s/it]
+[2025-01-01 03:25:50,875] [INFO] [logging.py:96:log_dist] [Rank 0] step=10, skipped=0, lr=[9.979871469976195e-07, 9.979871469976195e-07], mom=[[0.9, 0.95], [0.9, 0.95]]
+[2025-01-01 03:27:24,141] [WARNING] [stage3.py:2104:step] 1 pytorch allocator cache flushes since last step. this happens when there is high memory pressure and is detrimental to performance. if this is happening frequently consider adjusting settings to reduce memory consumption. If you are unable to make the cache flushes go away consider adding get_accelerator().empty_cache() calls in your training loop to ensure that all ranks flush their caches at the same time
+[2025-01-01 03:28:03,912] [WARNING] [stage3.py:2104:step] 1 pytorch allocator cache flushes since last step. this happens when there is high memory pressure and is detrimental to performance. if this is happening frequently consider adjusting settings to reduce memory consumption. If you are unable to make the cache flushes go away consider adding get_accelerator().empty_cache() calls in your training loop to ensure that all ranks flush their caches at the same time
+[2025-01-01 03:28:59,279] [INFO] [logging.py:96:log_dist] [Rank 0] step=20, skipped=0, lr=[9.819814303479267e-07, 9.819814303479267e-07], mom=[[0.9, 0.95], [0.9, 0.95]]
+[2025-01-01 03:29:39,906] [WARNING] [stage3.py:2104:step] 1 pytorch allocator cache flushes since last step. this happens when there is high memory pressure and is detrimental to performance. if this is happening frequently consider adjusting settings to reduce memory consumption. If you are unable to make the cache flushes go away consider adding get_accelerator().empty_cache() calls in your training loop to ensure that all ranks flush their caches at the same time
+[2025-01-01 03:32:04,668] [INFO] [logging.py:96:log_dist] [Rank 0] step=30, skipped=0, lr=[9.504844339512094e-07, 9.504844339512094e-07], mom=[[0.9, 0.95], [0.9, 0.95]]
+[2025-01-01 03:34:45,536] [INFO] [logging.py:96:log_dist] [Rank 0] step=40, skipped=0, lr=[9.045084971874737e-07, 9.045084971874737e-07], mom=[[0.9, 0.95], [0.9, 0.95]]
+[2025-01-01 03:35:12,727] [WARNING] [stage3.py:2104:step] 1 pytorch allocator cache flushes since last step. this happens when there is high memory pressure and is detrimental to performance. if this is happening frequently consider adjusting settings to reduce memory consumption. If you are unable to make the cache flushes go away consider adding get_accelerator().empty_cache() calls in your training loop to ensure that all ranks flush their caches at the same time
+[2025-01-01 03:38:11,474] [INFO] [logging.py:96:log_dist] [Rank 0] step=50, skipped=0, lr=[8.455313244934324e-07, 8.455313244934324e-07], mom=[[0.9, 0.95], [0.9, 0.95]]
+[2025-01-01 03:41:02,763] [INFO] [logging.py:96:log_dist] [Rank 0] step=60, skipped=0, lr=[7.754484907260512e-07, 7.754484907260512e-07], mom=[[0.9, 0.95], [0.9, 0.95]]
+[2025-01-01 03:44:21,088] [INFO] [logging.py:96:log_dist] [Rank 0] step=70, skipped=0, lr=[6.965125158269618e-07, 6.965125158269618e-07], mom=[[0.9, 0.95], [0.9, 0.95]]
+[2025-01-01 03:45:34,501] [WARNING] [stage3.py:2104:step] 1 pytorch allocator cache flushes since last step. this happens when there is high memory pressure and is detrimental to performance. if this is happening frequently consider adjusting settings to reduce memory consumption. If you are unable to make the cache flushes go away consider adding get_accelerator().empty_cache() calls in your training loop to ensure that all ranks flush their caches at the same time
+[2025-01-01 03:46:26,012] [WARNING] [stage3.py:2104:step] 1 pytorch allocator cache flushes since last step. this happens when there is high memory pressure and is detrimental to performance. if this is happening frequently consider adjusting settings to reduce memory consumption. If you are unable to make the cache flushes go away consider adding get_accelerator().empty_cache() calls in your training loop to ensure that all ranks flush their caches at the same time
+[2025-01-01 03:47:20,622] [INFO] [logging.py:96:log_dist] [Rank 0] step=80, skipped=0, lr=[6.112604669781572e-07, 6.112604669781572e-07], mom=[[0.9, 0.95], [0.9, 0.95]]
+[2025-01-01 03:48:01,672] [WARNING] [stage3.py:2104:step] 1 pytorch allocator cache flushes since last step. this happens when there is high memory pressure and is detrimental to performance. if this is happening frequently consider adjusting settings to reduce memory consumption. If you are unable to make the cache flushes go away consider adding get_accelerator().empty_cache() calls in your training loop to ensure that all ranks flush their caches at the same time
+[2025-01-01 03:50:25,146] [INFO] [logging.py:96:log_dist] [Rank 0] step=90, skipped=0, lr=[5.224324151752575e-07, 5.224324151752575e-07], mom=[[0.9, 0.95], [0.9, 0.95]]
+[2025-01-01 03:53:13,332] [INFO] [logging.py:96:log_dist] [Rank 0] step=100, skipped=0, lr=[4.328833670911724e-07, 4.328833670911724e-07], mom=[[0.9, 0.95], [0.9, 0.95]]
+[2025-01-01 03:53:40,009] [WARNING] [stage3.py:2104:step] 1 pytorch allocator cache flushes since last step. this happens when there is high memory pressure and is detrimental to performance. if this is happening frequently consider adjusting settings to reduce memory consumption. If you are unable to make the cache flushes go away consider adding get_accelerator().empty_cache() calls in your training loop to ensure that all ranks flush their caches at the same time
+[2025-01-01 03:56:31,314] [INFO] [logging.py:96:log_dist] [Rank 0] step=110, skipped=0, lr=[3.454915028125263e-07, 3.454915028125263e-07], mom=[[0.9, 0.95], [0.9, 0.95]]
+[2025-01-01 03:59:21,373] [INFO] [logging.py:96:log_dist] [Rank 0] step=120, skipped=0, lr=[2.6306566876350067e-07, 2.6306566876350067e-07], mom=[[0.9, 0.95], [0.9, 0.95]]
+[2025-01-01 04:02:48,482] [INFO] [logging.py:96:log_dist] [Rank 0] step=130, skipped=0, lr=[1.8825509907063326e-07, 1.8825509907063326e-07], mom=[[0.9, 0.95], [0.9, 0.95]]
+[2025-01-01 04:03:53,943] [WARNING] [stage3.py:2104:step] 1 pytorch allocator cache flushes since last step. this happens when there is high memory pressure and is detrimental to performance. if this is happening frequently consider adjusting settings to reduce memory consumption. If you are unable to make the cache flushes go away consider adding get_accelerator().empty_cache() calls in your training loop to ensure that all ranks flush their caches at the same time
+[2025-01-01 04:04:34,261] [WARNING] [stage3.py:2104:step] 1 pytorch allocator cache flushes since last step. this happens when there is high memory pressure and is detrimental to performance. if this is happening frequently consider adjusting settings to reduce memory consumption. If you are unable to make the cache flushes go away consider adding get_accelerator().empty_cache() calls in your training loop to ensure that all ranks flush their caches at the same time
+[2025-01-01 04:05:49,032] [INFO] [logging.py:96:log_dist] [Rank 0] step=140, skipped=0, lr=[1.2346426699819456e-07, 1.2346426699819456e-07], mom=[[0.9, 0.95], [0.9, 0.95]]
+[2025-01-01 04:06:10,044] [WARNING] [stage3.py:2104:step] 1 pytorch allocator cache flushes since last step. this happens when there is high memory pressure and is detrimental to performance. if this is happening frequently consider adjusting settings to reduce memory consumption. If you are unable to make the cache flushes go away consider adding get_accelerator().empty_cache() calls in your training loop to ensure that all ranks flush their caches at the same time
+[2025-01-01 04:08:45,003] [INFO] [logging.py:96:log_dist] [Rank 0] step=150, skipped=0, lr=[7.077560319906694e-08, 7.077560319906694e-08], mom=[[0.9, 0.95], [0.9, 0.95]]
+[2025-01-01 04:11:41,549] [WARNING] [stage3.py:2104:step] 1 pytorch allocator cache flushes since last step. this happens when there is high memory pressure and is detrimental to performance. if this is happening frequently consider adjusting settings to reduce memory consumption. If you are unable to make the cache flushes go away consider adding get_accelerator().empty_cache() calls in your training loop to ensure that all ranks flush their caches at the same time
+[2025-01-01 04:11:41,550] [INFO] [logging.py:96:log_dist] [Rank 0] step=160, skipped=0, lr=[3.188256468013139e-08, 3.188256468013139e-08], mom=[[0.9, 0.95], [0.9, 0.95]]
+[2025-01-01 04:14:59,506] [INFO] [logging.py:96:log_dist] [Rank 0] step=170, skipped=0, lr=[8.035205700685165e-09, 8.035205700685165e-09], mom=[[0.9, 0.95], [0.9, 0.95]]
+Saving model to "/data/align-anything/hantao/align-anything/outputs/mm_interp//q0_10_preference" ...
+Saving 16-bit model...
+[2025-01-01 04:17:25,228] [INFO] [logging.py:96:log_dist] [Rank 0] [Torch] Checkpoint global_step178 is about to be saved!
+[2025-01-01 04:17:25,229] [INFO] [engine.py:3649:save_16bit_model] Saving model weights to /data/align-anything/hantao/align-anything/outputs/mm_interp//q0_10_preference/pytorch_model.bin, tag: global_step178
+[2025-01-01 04:17:25,229] [INFO] [torch_checkpoint_engine.py:21:save] [Torch] Saving /data/align-anything/hantao/align-anything/outputs/mm_interp//q0_10_preference/pytorch_model.bin...
+[2025-01-01 04:17:45,184] [INFO] [torch_checkpoint_engine.py:23:save] [Torch] Saved /data/align-anything/hantao/align-anything/outputs/mm_interp//q0_10_preference/pytorch_model.bin.
+[2025-01-01 04:17:45,185] [INFO] [torch_checkpoint_engine.py:33:commit] [Torch] Checkpoint global_step178 is ready now!
+Model saved!
+Saving 16-bit model...
+[2025-01-01 04:17:52,182] [INFO] [logging.py:96:log_dist] [Rank 0] [Torch] Checkpoint global_step178 is about to be saved!
+[2025-01-01 04:17:52,183] [INFO] [engine.py:3649:save_16bit_model] Saving model weights to /data/align-anything/hantao/align-anything/outputs/mm_interp//q0_10_preference/pytorch_model.bin, tag: global_step178
+[2025-01-01 04:17:52,183] [INFO] [torch_checkpoint_engine.py:21:save] [Torch] Saving /data/align-anything/hantao/align-anything/outputs/mm_interp//q0_10_preference/pytorch_model.bin...
+[2025-01-01 04:18:12,699] [INFO] [torch_checkpoint_engine.py:23:save] [Torch] Saved /data/align-anything/hantao/align-anything/outputs/mm_interp//q0_10_preference/pytorch_model.bin.
+[2025-01-01 04:18:12,701] [INFO] [torch_checkpoint_engine.py:33:commit] [Torch] Checkpoint global_step178 is ready now!
+Model saved!

wandb/run-20250101_032225-2bzz3n13/files/requirements.txt ADDED Viewed

	@@ -0,0 +1,248 @@

+align-anything==0.0.1.dev0
+gitdb==4.0.11
+wcwidth==0.2.13
+identify==2.6.1
+tomlkit==0.12.0
+bitsandbytes==0.44.1
+trl==0.9.6
+pytest-split==0.8.0
+gradio==4.44.1
+pip==24.2
+multidict==6.1.0
+fairscale==0.4.13
+mistral_common==1.4.4
+python-dotenv==1.0.1
+uvloop==0.20.0
+absl-py==2.1.0
+tiktoken==0.7.0
+pydub==0.25.1
+websockets==12.0
+llamafactory==0.9.1.dev0
+triton==3.0.0
+tifffile==2024.9.20
+safe-rlhf==0.0.1.dev0
+pandas==2.2.3
+grpcio==1.66.2
+click==8.1.7
+ninja==1.11.1.1
+rich==13.9.2
+Jinja2==3.1.4
+Pygments==2.18.0
+nvidia-cudnn-cu12==9.1.0.70
+importlib_resources==6.4.5
+GitPython==3.1.43
+nvidia-cufft-cu12==11.0.2.54
+tensorboard-data-server==0.7.2
+align-anything==0.0.1.dev0
+six==1.16.0
+scipy==1.14.1
+mpmath==1.3.0
+jsonschema-specifications==2024.10.1
+scikit-image==0.24.0
+zipp==3.20.2
+cycler==0.12.1
+MarkupSafe==2.1.5
+tzdata==2024.2
+idna==3.10
+pycountry==24.6.1
+nvidia-nccl-cu12==2.20.5
+matplotlib==3.9.2
+pytz==2024.2
+uvicorn==0.31.1
+dill==0.3.8
+pyparsing==3.1.4
+pytest==7.2.0
+jiter==0.6.1
+safetensors==0.4.5
+typing_extensions==4.12.2
+decorator==4.4.2
+typeguard==4.4.1
+prometheus_client==0.21.0
+nvidia-cuda-cupti-cu12==12.1.105
+sentencepiece==0.2.0
+requests==2.32.3
+kiwisolver==1.4.7
+gdown==5.2.0
+multiprocess==0.70.16
+xxhash==3.5.0
+PyYAML==6.0.2
+gguf==0.10.0
+nvidia-nvtx-cu12==12.1.105
+hpsv2==1.2.0
+tensorboard==2.18.0
+nodeenv==1.9.1
+filelock==3.16.1
+distro==1.9.0
+scikit-learn==1.5.2
+huggingface-hub==0.25.2
+pyairports==2.1.1
+importlib_metadata==8.5.0
+pyarrow==17.0.0
+llvmlite==0.43.0
+ray==2.37.0
+tokenizers==0.20.3
+nvidia-nvjitlink-cu12==12.6.77
+av==14.0.1
+deepspeed==0.15.2
+clip==0.2.0
+shtab==1.7.1
+certifi==2024.8.30
+braceexpand==0.1.7
+nvidia-ml-py==12.560.30
+webdataset==0.2.100
+docker-pycreds==0.4.0
+einops==0.8.0
+iniconfig==2.0.0
+tyro==0.9.2
+torchvision==0.19.0
+accelerate==0.34.2
+beautifulsoup4==4.12.3
+pyzmq==26.2.0
+pycparser==2.22
+nvidia-curand-cu12==10.3.2.106
+msgpack==1.1.0
+soxr==0.5.0.post1
+platformdirs==4.3.6
+h11==0.14.0
+psutil==6.0.0
+pydantic==2.9.2
+shellingham==1.5.4
+imageio-ffmpeg==0.5.1
+wandb==0.18.3
+audioread==3.0.1
+annotated-types==0.7.0
+docstring_parser==0.16
+cloudpickle==3.1.0
+regex==2024.9.11
+packaging==24.1
+timm==0.6.13
+aiosignal==1.3.1
+numba==0.60.0
+orjson==3.10.7
+rpds-py==0.20.0
+virtualenv==20.26.6
+joblib==1.4.2
+charset-normalizer==3.4.0
+httpx==0.27.2
+ffmpy==0.4.0
+lm-format-enforcer==0.10.6
+yt-dlp==2024.8.6
+sympy==1.13.3
+python-dateutil==2.9.0.post0
+nvidia-cusolver-cu12==11.4.5.107
+msgspec==0.18.6
+mdurl==0.1.2
+torch==2.4.0
+fastapi==0.115.0
+optree==0.13.0
+PySocks==1.7.1
+transformers==4.46.0.dev0
+torchlibrosa==0.1.0
+fsspec==2024.6.1
+nvidia-cublas-cu12==12.1.3.1
+gradio_client==1.3.0
+args==0.1.0
+cffi==1.17.1
+fonttools==4.54.1
+clint==0.5.1
+lark==1.2.2
+tqdm==4.66.5
+semantic-version==2.10.0
+pooch==1.8.2
+markdown-it-py==3.0.0
+pydantic_core==2.23.4
+sniffio==1.3.1
+httptools==0.6.1
+nvidia-cuda-runtime-cu12==12.1.105
+anyio==4.6.0
+ftfy==6.3.0
+Markdown==3.7
+datasets==2.21.0
+diffusers==0.30.3
+nvidia-cuda-nvrtc-cu12==12.1.105
+vllm==0.6.2
+starlette==0.38.6
+flash-attn==2.7.0.post2
+urllib3==2.2.3
+Werkzeug==3.0.4
+py-cpuinfo==9.0.0
+moviepy==1.0.3
+librosa==0.10.2.post1
+peft==0.12.0
+soupsieve==2.6
+lazy_loader==0.4
+pluggy==1.5.0
+setuptools==75.1.0
+sentry-sdk==2.16.0
+tabulate==0.9.0
+transformers==4.45.2
+pre_commit==4.0.1
+termcolor==2.5.0
+frechet-audio-distance==0.1.2
+pytorch-fid==0.3.0
+setproctitle==1.3.3
+jsonschema==4.23.0
+aiofiles==23.2.1
+contourpy==1.3.0
+distlib==0.3.9
+interegular==0.3.3
+fire==0.7.0
+diskcache==5.6.3
+proglog==0.1.10
+soundfile==0.12.1
+protobuf==3.20.3
+smmap==5.0.1
+pycryptodomex==3.21.0
+Brotli==1.1.0
+pillow==10.4.0
+frozenlist==1.4.1
+numpy==1.26.4
+mutagen==1.47.0
+outlines==0.0.46
+attrs==24.2.0
+torchaudio==2.4.0
+aiohttp==3.10.10
+ruff==0.6.9
+watchfiles==0.24.0
+threadpoolctl==3.5.0
+nest-asyncio==1.6.0
+partial-json-parser==0.2.1.1.post4
+sse-starlette==2.1.3
+shortuuid==1.0.13
+typer==0.12.5
+prometheus-fastapi-instrumentator==7.0.0
+imageio==2.35.1
+wheel==0.44.0
+image-reward==1.5
+networkx==3.4.1
+propcache==0.2.0
+aiohappyeyeballs==2.4.3
+nvidia-cusparse-cu12==12.1.0.106
+xformers==0.0.27.post2
+cfgv==3.4.0
+python-multipart==0.0.12
+httpcore==1.0.6
+opencv-python==4.6.0.66
+resampy==0.4.3
+yarl==1.15.0
+referencing==0.35.1
+openai==1.51.2
+hjson==3.1.0
+llamafactory==0.9.1.dev0
+jaraco.collections==5.1.0
+backports.tarfile==1.2.0
+more-itertools==10.3.0
+wheel==0.43.0
+importlib_metadata==8.0.0
+zipp==3.19.2
+autocommand==2.2.2
+jaraco.functools==4.0.1
+platformdirs==4.2.2
+tomli==2.0.1
+jaraco.text==3.12.1
+typing_extensions==4.12.2
+jaraco.context==5.3.0
+importlib_resources==6.4.0
+packaging==24.1
+inflect==7.3.1
+typeguard==4.3.0

wandb/run-20250101_032225-2bzz3n13/files/wandb-metadata.json ADDED Viewed

	@@ -0,0 +1,112 @@

+{
+  "os":  "Linux-5.4.0-196-generic-x86_64-with-glibc2.31",
+  "python":  "3.11.10",
+  "startedAt":  "2025-01-01T03:22:25.748812Z",
+  "args":  [
+    "--local_rank=0",
+    "--model_name_or_path",
+    "/data/align-anything/hantao/models/chameleon-7b",
+    "--train_datasets",
+    "/data/align-anything/hantao/data/mm_interp/AA_preference_cocour_new_step10/tokenized",
+    "--output_dir",
+    "/data/align-anything/hantao/align-anything/outputs/mm_interp//q0_10_preference",
+    "--per_device_train_batch_size",
+    "4",
+    "--per_device_eval_batch_size",
+    "4",
+    "--gradient_accumulation_steps",
+    "2",
+    "--train_template",
+    "Chameleon_preference",
+    "--train_split",
+    "train",
+    "--train_data_files",
+    "q0_10_preference.pt",
+    "--learning_rate",
+    "1e-6",
+    "--epochs",
+    "3",
+    "--lr_scheduler_type",
+    "cosine",
+    "--save_interval",
+    "400"
+  ],
+  "program":  "-m align_anything.trainers.text_image_to_text_image.dpo",
+  "git":  {
+    "remote":  "https://github.com/PKU-Alignment/align-anything.git",
+    "commit":  "6fde660afc9985323f147930eedf188a5699adc7"
+  },
+  "email":  "[email protected]",
+  "root":  "/data/align-anything/hantao/align-anything/outputs/mm_interp//q0_10_preference",
+  "host":  "lyg0194",
+  "username":  "align-anything",
+  "executable":  "/data/align-anything/miniconda3/envs/hantao_stable/bin/python",
+  "cpu_count":  64,
+  "cpu_count_logical":  128,
+  "gpu":  "[NVIDIA A100-SXM4-80GB, NVIDIA A100-SXM4-80GB, NVIDIA A100-SXM4-80GB, NVIDIA A100-SXM4-80GB, NVIDIA A100-SXM4-80GB, NVIDIA A100-SXM4-80GB, NVIDIA A100-SXM4-80GB, NVIDIA A100-SXM4-80GB]",
+  "gpu_count":  8,
+  "disk":  {
+    "/":  {
+      "total":  "939477946368",
+      "used":  "596693139456"
+    }
+  },
+  "memory":  {
+    "total":  "1081823907840"
+  },
+  "cpu":  {
+    "count":  64,
+    "countLogical":  128
+  },
+  "gpu_nvidia":  [
+    {
+      "name":  "NVIDIA A100-SXM4-80GB",
+      "memoryTotal":  "85899345920",
+      "cudaCores":  6912,
+      "architecture":  "Ampere"
+    },
+    {
+      "name":  "NVIDIA A100-SXM4-80GB",
+      "memoryTotal":  "85899345920",
+      "cudaCores":  6912,
+      "architecture":  "Ampere"
+    },
+    {
+      "name":  "NVIDIA A100-SXM4-80GB",
+      "memoryTotal":  "85899345920",
+      "cudaCores":  6912,
+      "architecture":  "Ampere"
+    },
+    {
+      "name":  "NVIDIA A100-SXM4-80GB",
+      "memoryTotal":  "85899345920",
+      "cudaCores":  6912,
+      "architecture":  "Ampere"
+    },
+    {
+      "name":  "NVIDIA A100-SXM4-80GB",
+      "memoryTotal":  "85899345920",
+      "cudaCores":  6912,
+      "architecture":  "Ampere"
+    },
+    {
+      "name":  "NVIDIA A100-SXM4-80GB",
+      "memoryTotal":  "85899345920",
+      "cudaCores":  6912,
+      "architecture":  "Ampere"
+    },
+    {
+      "name":  "NVIDIA A100-SXM4-80GB",
+      "memoryTotal":  "85899345920",
+      "cudaCores":  6912,
+      "architecture":  "Ampere"
+    },
+    {
+      "name":  "NVIDIA A100-SXM4-80GB",
+      "memoryTotal":  "85899345920",
+      "cudaCores":  6912,
+      "architecture":  "Ampere"
+    }
+  ],
+  "cudaVersion":  "12.4"
+}

wandb/run-20250101_032225-2bzz3n13/files/wandb-summary.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"train/better_sample_reward":156.75074768066406,"train/worse_sample_reward":33.601295471191406,"train/reward":190.35205078125,"_wandb":{"runtime":3347},"_runtime":3347.002538272,"train/step":357,"train/loss":0.00119595427531749,"_step":357,"train/reward_margin":123.14945220947266,"train/lr":3.22238178339318e-10,"train/reward_accuracy":1,"train/epoch":3,"_timestamp":1.7357050364626048e+09}

wandb/run-20250101_032225-2bzz3n13/logs/debug-internal.log ADDED Viewed

	@@ -0,0 +1,20 @@

+{"time":"2025-01-01T03:22:25.755777689Z","level":"INFO","msg":"using version","core version":"0.18.3"}
+{"time":"2025-01-01T03:22:25.755807853Z","level":"INFO","msg":"created symlink","path":"/data/align-anything/hantao/align-anything/outputs/mm_interp/q0_10_preference/wandb/run-20250101_032225-2bzz3n13/logs/debug-core.log"}
+{"time":"2025-01-01T03:22:25.758235027Z","level":"ERROR","msg":"dialing: google: could not find default credentials. See https://cloud.google.com/docs/authentication/external/set-up-adc for more information"}
+{"time":"2025-01-01T03:22:25.778926827Z","level":"INFO","msg":"created new stream","id":"2bzz3n13"}
+{"time":"2025-01-01T03:22:25.778989066Z","level":"INFO","msg":"stream: started","id":"2bzz3n13"}
+{"time":"2025-01-01T03:22:25.779016519Z","level":"INFO","msg":"writer: Do: started","stream_id":{"value":"2bzz3n13"}}
+{"time":"2025-01-01T03:22:25.779052686Z","level":"INFO","msg":"sender: started","stream_id":{"value":"2bzz3n13"}}
+{"time":"2025-01-01T03:22:25.779034819Z","level":"INFO","msg":"handler: started","stream_id":{"value":"2bzz3n13"}}
+{"time":"2025-01-01T03:22:26.392432178Z","level":"INFO","msg":"wandb-core","!BADKEY":null}
+{"time":"2025-01-01T03:22:26.39641254Z","level":"INFO","msg":"Starting system monitor"}
+{"time":"2025-01-01T04:18:12.751361379Z","level":"INFO","msg":"Stopping system monitor"}
+{"time":"2025-01-01T04:18:12.776637037Z","level":"INFO","msg":"Stopped system monitor"}
+{"time":"2025-01-01T04:18:13.326901072Z","level":"WARN","msg":"No program path found, not creating job artifact. See https://docs.wandb.ai/guides/launch/create-job"}
+{"time":"2025-01-01T04:18:13.326920848Z","level":"INFO","msg":"sender: sendDefer: no job artifact to save"}
+{"time":"2025-01-01T04:18:14.470754716Z","level":"INFO","msg":"fileTransfer: Close: file transfer manager closed"}
+{"time":"2025-01-01T04:18:16.234531428Z","level":"INFO","msg":"stream: closing","id":"2bzz3n13"}
+{"time":"2025-01-01T04:18:16.234542406Z","level":"INFO","msg":"handler: closed","stream_id":{"value":"2bzz3n13"}}
+{"time":"2025-01-01T04:18:16.234551344Z","level":"INFO","msg":"writer: Close: closed","stream_id":{"value":"2bzz3n13"}}
+{"time":"2025-01-01T04:18:16.23457812Z","level":"INFO","msg":"sender: closed","stream_id":{"value":"2bzz3n13"}}
+{"time":"2025-01-01T04:18:16.236373925Z","level":"INFO","msg":"stream: closed","id":"2bzz3n13"}

wandb/run-20250101_032225-2bzz3n13/logs/debug.log ADDED Viewed

	@@ -0,0 +1,33 @@

+2025-01-01 03:22:25,741 INFO    MainThread:650483 [wandb_setup.py:_flush():79] Current SDK version is 0.18.3
+2025-01-01 03:22:25,742 INFO    MainThread:650483 [wandb_setup.py:_flush():79] Configure stats pid to 650483
+2025-01-01 03:22:25,742 INFO    MainThread:650483 [wandb_setup.py:_flush():79] Loading settings from /home/align-anything/.config/wandb/settings
+2025-01-01 03:22:25,742 INFO    MainThread:650483 [wandb_setup.py:_flush():79] Loading settings from /data/align-anything/hantao/align-anything/scripts/wandb/settings
+2025-01-01 03:22:25,742 INFO    MainThread:650483 [wandb_setup.py:_flush():79] Loading settings from environment variables: {'api_key': '***REDACTED***', 'mode': 'online'}
+2025-01-01 03:22:25,742 INFO    MainThread:650483 [wandb_setup.py:_flush():79] Applying setup settings: {'mode': 'online', '_disable_service': None}
+2025-01-01 03:22:25,742 WARNING MainThread:650483 [wandb_setup.py:_flush():79] Could not find program at -m align_anything.trainers.text_image_to_text_image.dpo
+2025-01-01 03:22:25,742 INFO    MainThread:650483 [wandb_setup.py:_flush():79] Inferring run settings from compute environment: {'program_relpath': None, 'program': '-m align_anything.trainers.text_image_to_text_image.dpo'}
+2025-01-01 03:22:25,742 INFO    MainThread:650483 [wandb_setup.py:_flush():79] Applying login settings: {}
+2025-01-01 03:22:25,742 INFO    MainThread:650483 [wandb_init.py:_log_setup():532] Logging user logs to /data/align-anything/hantao/align-anything/outputs/mm_interp//q0_10_preference/wandb/run-20250101_032225-2bzz3n13/logs/debug.log
+2025-01-01 03:22:25,742 INFO    MainThread:650483 [wandb_init.py:_log_setup():533] Logging internal logs to /data/align-anything/hantao/align-anything/outputs/mm_interp//q0_10_preference/wandb/run-20250101_032225-2bzz3n13/logs/debug-internal.log
+2025-01-01 03:22:25,742 INFO    MainThread:650483 [wandb_init.py:init():617] calling init triggers
+2025-01-01 03:22:25,742 INFO    MainThread:650483 [wandb_init.py:init():624] wandb.init called with sweep_config: {}
+config: {'train_cfgs': {'ds_cfgs': 'ds_z3_config.json', 'epochs': 3.0, 'seed': 42, 'per_device_train_batch_size': 4.0, 'per_device_eval_batch_size': 4.0, 'gradient_accumulation_steps': 2.0, 'gradient_checkpointing': True, 'learning_rate': 1e-06, 'lr_scheduler_type': 'cosine', 'lr_warmup_ratio': 0.03, 'weight_decay': 0.01, 'adam_betas': [0.9, 0.95], 'bf16': True, 'fp16': False, 'eval_strategy': 'epoch', 'eval_interval': 10, 'regularization': 0.001, 'scale_coeff': 0.1, 'freeze_mm_proj': True, 'freeze_vision_tower': False, 'freeze_language_model': True}, 'data_cfgs': {'train_datasets': '/data/align-anything/hantao/data/mm_interp/AA_preference_cocour_new_step10/tokenized', 'train_template': 'Chameleon_preference', 'train_size': None, 'train_split': 'train', 'train_subset': None, 'train_data_files': 'q0_10_preference.pt', 'train_optional_args': [], 'eval_datasets': None, 'eval_template': None, 'eval_size': None, 'eval_split': None, 'eval_subset': None, 'eval_data_files': None, 'eval_optional_args': []}, 'logger_cfgs': {'log_type': 'wandb', 'log_project': 'align-anything', 'log_run_name': 'dpo', 'output_dir': '/data/align-anything/hantao/align-anything/outputs/mm_interp//q0_10_preference', 'cache_dir': None, 'save_interval': 400.0}, 'model_cfgs': {'model_name_or_path': '/data/align-anything/hantao/models/chameleon-7b', 'trust_remote_code': True, 'model_max_length': 4096}, 'special_tokens': None}
+2025-01-01 03:22:25,742 INFO    MainThread:650483 [wandb_init.py:init():667] starting backend
+2025-01-01 03:22:25,742 INFO    MainThread:650483 [wandb_init.py:init():671] sending inform_init request
+2025-01-01 03:22:25,748 INFO    MainThread:650483 [backend.py:_multiprocessing_setup():104] multiprocessing start_methods=fork,spawn,forkserver, using: spawn
+2025-01-01 03:22:25,748 INFO    MainThread:650483 [wandb_init.py:init():684] backend started and connected
+2025-01-01 03:22:25,758 INFO    MainThread:650483 [wandb_init.py:init():779] updated telemetry
+2025-01-01 03:22:25,803 INFO    MainThread:650483 [wandb_init.py:init():812] communicating run to backend with 90.0 second timeout
+2025-01-01 03:22:26,388 INFO    MainThread:650483 [wandb_init.py:init():863] starting run threads in backend
+2025-01-01 03:22:26,708 INFO    MainThread:650483 [wandb_run.py:_console_start():2465] atexit reg
+2025-01-01 03:22:26,708 INFO    MainThread:650483 [wandb_run.py:_redirect():2313] redirect: wrap_raw
+2025-01-01 03:22:26,708 INFO    MainThread:650483 [wandb_run.py:_redirect():2378] Wrapping output streams.
+2025-01-01 03:22:26,708 INFO    MainThread:650483 [wandb_run.py:_redirect():2403] Redirects installed.
+2025-01-01 03:22:26,713 INFO    MainThread:650483 [wandb_init.py:init():907] run started, returning control to user process
+2025-01-01 04:18:12,748 INFO    MainThread:650483 [wandb_run.py:_finish():2164] finishing run htlou/align-anything/2bzz3n13
+2025-01-01 04:18:12,750 INFO    MainThread:650483 [wandb_run.py:_atexit_cleanup():2428] got exitcode: 0
+2025-01-01 04:18:12,750 INFO    MainThread:650483 [wandb_run.py:_restore():2410] restore
+2025-01-01 04:18:12,750 INFO    MainThread:650483 [wandb_run.py:_restore():2416] restore done
+2025-01-01 04:18:16,219 INFO    MainThread:650483 [wandb_run.py:_footer_history_summary_info():4049] rendering history
+2025-01-01 04:18:16,221 INFO    MainThread:650483 [wandb_run.py:_footer_history_summary_info():4081] rendering summary
+2025-01-01 04:18:16,232 INFO    MainThread:650483 [wandb_run.py:_footer_sync_info():4008] logging synced files

wandb/run-20250101_032225-2bzz3n13/run-2bzz3n13.wandb ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b24dc144b11274c9e88c6af74302af6ce2fbfcdcbbcbaab785ec88157d14e38f
+size 3363509