Yuanxing Zhang's picture

4 2

Yuanxing Zhang

LongoXC

AI & ML interests

None yet

Recent Activity

authored a paper 2 days ago

CodeCriticBench: A Holistic Code Critique Benchmark for Large Language Models

upvoted a paper 2 days ago

CodeCriticBench: A Holistic Code Critique Benchmark for Large Language Models

liked a dataset 3 months ago

HuggingFaceTB/smoltalk

View all activity

Organizations

None yet

LongoXC's activity

upvoted a paper 2 days ago

CodeCriticBench: A Holistic Code Critique Benchmark for Large Language Models

Paper • 2502.16614 • Published 4 days ago • 22

upvoted 2 papers 4 months ago

Chinese SimpleQA: A Chinese Factuality Evaluation for Large Language Models

Paper • 2411.07140 • Published Nov 11, 2024 • 33

MTU-Bench: A Multi-granularity Tool-Use Benchmark for Large Language Models

Paper • 2410.11710 • Published Oct 15, 2024 • 20

upvoted a paper 5 months ago

MIO: A Foundation Model on Multimodal Tokens

Paper • 2409.17692 • Published Sep 26, 2024 • 53