Spaces:

walaa2022
/

lumenex

Sleeping

walaa2022 commited on May 29

Commit

b0a246e

verified ·

1 Parent(s): 97f3940

Upload 2 files

Files changed (2) hide show

run.sh ADDED Viewed

+#!/bin/bash
+conda activate  blip3o
+export HF_HOME=/HF/Home/
+export OUTPUT_FOLDER=/Your/Model/Output/
+export IMG_FOLDER=/Your/Image/Folder
+torchrun --nproc_per_node=8 \
+    blip3o/train/train_mem.py \
+    --deepspeed ./deepspeed_scripts/zero1.json \
+    --model_name_or_path Qwen/Qwen2.5-VL-7B-Instruct  \
+    --version qwen \
+    --data_type "mix" \
+    --image_folder ${IMG_FOLDER} \
+    --gen_vision_tower eva-clip-E-14-plus \
+    --gen_projector_type mlp2x_gelu \
+    --mm_projector_type mlp2x_gelu \
+    --mm_vision_select_layer -2 \
+    --mm_use_im_start_end False \
+    --mm_use_im_patch_token False \
+    --bf16 True \
+    --output_dir ${OUTPUT_FOLDER} \
+    --num_train_epochs 1 \
+    --per_device_train_batch_size 16 \
+    --per_device_eval_batch_size 4 \
+    --gradient_accumulation_steps 1 \
+    --eval_strategy "no" \
+    --save_strategy "steps" \
+    --save_steps 1000 \
+    --save_total_limit 1 \
+    --learning_rate 1e-4 \
+    --weight_decay 0. \
+    --warmup_ratio 0.003 \
+    --lr_scheduler_type "cosine_with_min_lr" \
+    --lr_scheduler_kwargs '{"min_lr":1e-5}' \
+    --model_max_length 512 \
+    --logging_steps 1 \
+    --tf32 True \
+    --gradient_checkpointing True \
+    --dataloader_num_workers 4 \
+    --lazy_preprocess True \
+    --gen_pooling early_pool2d_4 \
+    --n_query 64 \
+    --n_und_query 0 \
+    --report_to none \
+    --run_name blip3o_qwen_vl_7b

setup.py ADDED Viewed

+from setuptools import setup, find_packages
+setup(
+    name="blip3o",
+    version="0.1.0",
+    packages=find_packages(),
+)