Jaehyun Jun's picture

Jaehyun Jun

btjhjeon

·

https://btjhjeon.github.io/

btjhjeon

AI & ML interests

Multimodal

Recent Activity

liked a dataset about 2 hours ago

Nagase-Kotono/LLaVA-CoT-ko

upvoted a paper about 2 hours ago

R1-Onevision: Advancing Generalized Multimodal Reasoning through Cross-Modal Formalization

updated a collection about 2 hours ago

Multimodal Analysis

View all activity

Organizations

btjhjeon's activity

liked a dataset about 2 hours ago

Nagase-Kotono/LLaVA-CoT-ko

Updated Feb 8 • 64 • 2

upvoted a paper about 2 hours ago

R1-Onevision: Advancing Generalized Multimodal Reasoning through Cross-Modal Formalization

Paper • 2503.10615 • Published 3 days ago • 14

updated a collection about 2 hours ago

Multimodal Analysis

4 items • Updated about 2 hours ago • 1

upvoted 2 papers about 2 hours ago

On the Limitations of Vision-Language Models in Understanding Image Transforms

Paper • 2503.09837 • Published 4 days ago • 7

TruthPrInt: Mitigating LVLM Object Hallucination Via Latent Truthful-Guided Pre-Intervention

Paper • 2503.10602 • Published 3 days ago • 4

liked a dataset about 2 hours ago

tabtoyou/KoTextVQA

Viewer • Updated 1 day ago • 2.58k • 313 • 6

updated 2 collections about 8 hours ago

Multimodal Benchmarks

82 items • Updated about 8 hours ago • 8

Multimodal Reasoning

16 items • Updated about 8 hours ago • 1

upvoted a paper about 8 hours ago

VisualWebInstruct: Scaling up Multimodal Instruction Data through Web Search

Paper • 2503.10582 • Published 3 days ago • 16

updated 3 collections about 8 hours ago

Multimodal LLM

174 items • Updated about 8 hours ago • 14

Multimodal Dataset

36 items • Updated about 8 hours ago • 2

Multimodal Reasoning

16 items • Updated about 8 hours ago • 1

upvoted a paper about 8 hours ago

VisualPRM: An Effective Process Reward Model for Multimodal Reasoning

Paper • 2503.10291 • Published 3 days ago • 28

updated 2 collections about 8 hours ago

Multimodal Benchmarks

82 items • Updated about 8 hours ago • 8

Multimodal Alignment

15 items • Updated about 8 hours ago • 2

upvoted a paper about 8 hours ago

GoT: Unleashing Reasoning Capability of Multimodal Large Language Model for Visual Generation and Editing

Paper • 2503.10639 • Published 3 days ago • 37

updated a collection about 8 hours ago

Multimodal Dataset

36 items • Updated about 8 hours ago • 2

upvoted a paper 3 days ago

R1-Omni: Explainable Omni-Multimodal Emotion Recognition with Reinforcing Learning

Paper • 2503.05379 • Published 9 days ago • 32