Add files using upload-large-folder tool

Files changed (5) hide show

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "liuhaotian/llava-v1.6-vicuna-7b",
   "architectures": [
     "LlavaLlamaForCausalLM"
   ],
@@ -10,34 +10,11 @@
   "freeze_mm_mlp_adapter": false,
   "freeze_mm_vision_resampler": false,
   "hidden_act": "silu",
-  "hidden_size": 4096,
   "image_aspect_ratio": "pad",
-  "image_crop_resolution": 224,
-  "image_grid_pinpoints": [
-    [
-      336,
-      672
-    ],
-    [
-      672,
-      336
-    ],
-    [
-      672,
-      672
-    ],
-    [
-      1008,
-      336
-    ],
-    [
-      336,
-      1008
-    ]
-  ],
-  "image_split_resolution": 224,
   "initializer_range": 0.02,
-  "intermediate_size": 11008,
   "max_position_embeddings": 4096,
   "mm_hidden_size": 1024,
   "mm_patch_merge_type": "flat",
@@ -49,11 +26,10 @@
   "mm_vision_select_feature": "patch",
   "mm_vision_select_layer": -2,
   "mm_vision_tower": "openai/clip-vit-large-patch14-336",
-  "mm_vision_tower_lr": 2e-06,
   "model_type": "llava_llama",
-  "num_attention_heads": 32,
-  "num_hidden_layers": 32,
-  "num_key_value_heads": 32,
   "pad_token_id": 0,
   "pretraining_tp": 1,
   "rms_norm_eps": 1e-05,
@@ -66,7 +42,7 @@
   "transformers_version": "4.37.2",
   "tune_mm_mlp_adapter": false,
   "tune_mm_vision_resampler": false,
-  "unfreeze_mm_vision_tower": true,
   "use_cache": true,
   "use_mm_proj": true,
   "vocab_size": 32000

 {
+  "_name_or_path": "liuhaotian/llava-v1.5-13b",
   "architectures": [
     "LlavaLlamaForCausalLM"
   ],
   "freeze_mm_mlp_adapter": false,
   "freeze_mm_vision_resampler": false,
   "hidden_act": "silu",
+  "hidden_size": 5120,
   "image_aspect_ratio": "pad",
   "initializer_range": 0.02,
+  "intermediate_size": 13824,
+  "max_length": 4096,
   "max_position_embeddings": 4096,
   "mm_hidden_size": 1024,
   "mm_patch_merge_type": "flat",
   "mm_vision_select_feature": "patch",
   "mm_vision_select_layer": -2,
   "mm_vision_tower": "openai/clip-vit-large-patch14-336",
   "model_type": "llava_llama",
+  "num_attention_heads": 40,
+  "num_hidden_layers": 40,
+  "num_key_value_heads": 40,
   "pad_token_id": 0,
   "pretraining_tp": 1,
   "rms_norm_eps": 1e-05,
   "transformers_version": "4.37.2",
   "tune_mm_mlp_adapter": false,
   "tune_mm_vision_resampler": false,
+  "unfreeze_mm_vision_tower": false,
   "use_cache": true,
   "use_mm_proj": true,
   "vocab_size": 32000

generation_config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "attn_implementation": "sdpa",
   "bos_token_id": 1,
   "eos_token_id": 2,
   "max_length": 4096,

 {
+  "_from_model_config": true,
   "bos_token_id": 1,
   "eos_token_id": 2,
   "max_length": 4096,

model.safetensors.index.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

trainer_state.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fa15bf6bd426c445074768ad2dbeee998a2e2d0a27035e3cca9d1cc693b21d57
 size 6776

 version https://git-lfs.github.com/spec/v1
+oid sha256:4661a4e49e1755636c80f25b15f04a6768a59aa456cfee7bc457320ccb3d7614
 size 6776