DeepGlint-AI
/

mlcd-vit-large-patch14-336

Feature Extraction

clip_vision_model

Model card Files Files and versions Community

xiangan commited on Oct 14, 2024

Commit

14fd13e

·

verified ·

1 Parent(s): cf984ef

Update README.md

Files changed (1) hide show

README.md +7 -6

README.md CHANGED Viewed

@@ -25,22 +25,23 @@ In our experiments, we replaced the CLIP model in [LLaVA-NeXT](https://github.co
 |:----------------|:-------------|:-------------|
 | LLM             | Qwen2.5-7B   |   Qwen2.5-7B |
 | AI2D            | **76.98**    | 73.15        |
-| ChartQA         | **67.84**    | 66.52        |
-| DocVQA_val      | **76.46**    | 75.21        |
 | GQA             | **64.17**    | 63.31        |
 | InfoVQA_val     | **43.48**    | 38.88        |
 | MMBench_cn_dev  | **74.83**    | 72.51        |
 | MMBench_en_dev  | **76.37**    | 74.57        |
 | MME(cognition)  | **432**      | 384          |
 | MME(perception) | **1598**     | 1512         |
 | MMMU            | **44.30**    | 44.20        |
 | OCRBench        | **531.00**   | 525.00       |
 | POPE            | 88.69        | **88.83**    |
-| ScienceQA_img   | **78.09**    | 76.35        |
 | TextVQA_val     | 61.69        | **62.47**    |
-| SeedBench       | **68.20**    | 66.80        |
-| SeedBench_img   | **73.75**    | 72.72        |
-| MMStar          | **50.98**    | 48.98        |

 |:----------------|:-------------|:-------------|
 | LLM             | Qwen2.5-7B   |   Qwen2.5-7B |
 | AI2D            | **76.98**    | 73.15        |
+| ScienceQA_img   | **78.09**    | 76.35        |
 | GQA             | **64.17**    | 63.31        |
 | InfoVQA_val     | **43.48**    | 38.88        |
 | MMBench_cn_dev  | **74.83**    | 72.51        |
 | MMBench_en_dev  | **76.37**    | 74.57        |
 | MME(cognition)  | **432**      | 384          |
 | MME(perception) | **1598**     | 1512         |
+| SeedBench       | **68.20**    | 66.80        |
+| SeedBench_img   | **73.75**    | 72.72        |
+| MMStar          | **50.98**    | 48.98        |
 | MMMU            | **44.30**    | 44.20        |
 | OCRBench        | **531.00**   | 525.00       |
+| ChartQA         | **67.84**    | 66.52        |
+| DocVQA_val      | **76.46**    | 75.21        |
 | POPE            | 88.69        | **88.83**    |
 | TextVQA_val     | 61.69        | **62.47**    |