zhu's picture

4 24 1

zhu

xuekai

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 1 month ago

Reasoning with Exploration: An Entropy Perspective

upvoted a paper about 2 months ago

RuleReasoner: Reinforced Rule-based Reasoning via Domain-aware Dynamic Sampling

upvoted a paper 2 months ago

The Entropy Mechanism of Reinforcement Learning for Reasoning Language Models

View all activity

Organizations

Papers 5

arxiv:2505.13308

arxiv:2504.16084

arxiv:2503.11224

arxiv:2412.14689

models 0

None public yet

datasets 1

xuekai/pad_train

Viewer • Updated Mar 21, 2024 • 184k • 11