Jade's picture

Jade

euclaise

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 2 days ago

Sample More to Think Less: Group Filtered Policy Optimization for Concise Reasoning

upvoted a paper 2 days ago

μ-Parametrization for Mixture of Experts

upvoted a paper 2 days ago

Noise Hypernetworks: Amortizing Test-Time Compute in Diffusion Models

View all activity

Organizations

upvoted 4 papers 2 days ago

Sample More to Think Less: Group Filtered Policy Optimization for Concise Reasoning

Paper • 2508.09726 • Published 4 days ago • 7

μ-Parametrization for Mixture of Experts

Paper • 2508.09752 • Published 4 days ago • 6

Noise Hypernetworks: Amortizing Test-Time Compute in Diffusion Models

Paper • 2508.09968 • Published 4 days ago • 13

Diffusion LLMs Can Do Faster-Than-AR Inference via Discrete Diffusion Forcing

Paper • 2508.09192 • Published 10 days ago • 29

liked a model 6 days ago

Qwen/Qwen-Image

Text-to-Image • Updated 12 days ago • 91.7k • • 1.68k

upvoted a paper 6 days ago

GLM-4.5: Agentic, Reasoning, and Coding (ARC) Foundation Models

Paper • 2508.06471 • Published 9 days ago • 140

liked a dataset 20 days ago

sapientinc/sudoku-extreme

Viewer • Updated Oct 17, 2024 • 4.25M • 4.43k • 15

liked a model 20 days ago

zai-org/GLM-4.5

Text Generation • 358B • Updated 6 days ago • 23.9k • • 1.21k

upvoted a paper 25 days ago

Zebra-CoT: A Dataset for Interleaved Vision Language Reasoning

Paper • 2507.16746 • Published 26 days ago • 33

upvoted 7 papers 26 days ago

BlockFFN: Towards End-Side Acceleration-Friendly Mixture-of-Experts with Chunk-Level Activation Sparsity

Paper • 2507.08771 • Published Jul 11 • 9

FLEXITOKENS: Flexible Tokenization for Evolving Language Models

Paper • 2507.12720 • Published Jul 17 • 9

Inverse Reinforcement Learning Meets Large Language Model Post-Training: Basics, Advances, and Opportunities

Paper • 2507.13158 • Published Jul 17 • 24

The Serial Scaling Hypothesis

Paper • 2507.12549 • Published Jul 16 • 9

Latent Denoising Makes Good Visual Tokenizers

Paper • 2507.15856 • Published 27 days ago • 9

Stabilizing Knowledge, Promoting Reasoning: Dual-Token Constraints for RLVR

Paper • 2507.15778 • Published 27 days ago • 19

The Invisible Leash: Why RLVR May Not Escape Its Origin

Paper • 2507.14843 • Published 29 days ago • 84

upvoted a paper 29 days ago

Reasoning or Memorization? Unreliable Results of Reinforcement Learning Due to Data Contamination

Paper • 2507.10532 • Published Jul 14 • 85

liked 2 models 29 days ago

jhu-clsp/ettin-decoder-1b

Fill-Mask • Updated 28 days ago • 461 • 3

jhu-clsp/ettin-encoder-1b

Feature Extraction • Updated about 1 month ago • 6.82k • 14

upvoted a paper 29 days ago

Seq vs Seq: An Open Suite of Paired Encoders and Decoders

Paper • 2507.11412 • Published Jul 15 • 25