1 38 95

momo

wzc991222

AI & ML interests

None yet

Recent Activity

upvoted a paper 2 days ago

YuE: Scaling Open Foundation Models for Long-Form Music Generation

upvoted a paper 11 days ago

Sim-to-Real Reinforcement Learning for Vision-Based Dexterous Manipulation on Humanoids

liked a model 16 days ago

nvidia/DeepSeek-R1-FP4

View all activity

Organizations

wzc991222's activity

upvoted a paper 2 days ago

YuE: Scaling Open Foundation Models for Long-Form Music Generation

Paper • 2503.08638 • Published 3 days ago • 53

upvoted a paper 11 days ago

Sim-to-Real Reinforcement Learning for Vision-Based Dexterous Manipulation on Humanoids

Paper • 2502.20396 • Published 14 days ago • 12

liked a model 16 days ago

nvidia/DeepSeek-R1-FP4

Text Generation • Updated 15 days ago • 8.41k • 208

liked a model 17 days ago

nomic-ai/nomic-embed-text-v2-moe

upvoted a paper 22 days ago

RAD: Training an End-to-End Driving Policy via Large-Scale 3DGS-based Reinforcement Learning

Paper • 2502.13144 • Published 23 days ago • 37

liked a Space 22 days ago

2.24k

The Ultra-Scale Playbook

🌌

The ultimate guide to training LLM on large GPU Clusters

upvoted a paper 24 days ago

Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention

Paper • 2502.11089 • Published 26 days ago • 142

liked a model 24 days ago

THUdyh/Ola-7b

Any-to-Any • Updated 23 days ago • 3.99k • 30

upvoted a paper 25 days ago

Large Language Diffusion Models

Paper • 2502.09992 • Published 28 days ago • 103

liked a model 27 days ago

unsloth/DeepSeek-R1-GGUF

Text Generation • Updated 29 days ago • 4.78M • 989

liked 4 models about 2 months ago

liked a model 2 months ago

microsoft/phi-4

Text Generation • Updated 18 days ago • 505k • • 1.9k

commented a paper 2 months ago

2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining

Paper • 2501.00958 • Published Jan 1 • 100 •

upvoted a paper 2 months ago

DeepSeek-V3 Technical Report

Paper • 2412.19437 • Published Dec 27, 2024 • 55

upvoted a collection 2 months ago

Deepseek Papers

Collection

Deepseek papers collection • 18 items • Updated 24 days ago • 168

upvoted a paper 3 months ago

YuLan-Mini: An Open Data-efficient Language Model

Paper • 2412.17743 • Published Dec 23, 2024 • 65

liked a model 3 months ago

deepseek-ai/DeepSeek-V3

Text Generation • Updated 18 days ago • 3.12M • • 3.63k