ZiYi Yang's picture

4 14 8

ZiYi Yang

AALF

·

https://github.com/yangzy39

yangzy39

AI & ML interests

None yet

Recent Activity

authored a paper 5 days ago

ThinkSwitcher: When to Think Hard, When to Think Fast

authored a paper 5 days ago

Mutual-Taught for Co-adapting Policy and Reward Models

authored a paper 5 days ago

FuseRL: Dense Preference Optimization for Heterogeneous Model Fusion

View all activity

Organizations

AALF 's models 7

AALF/FuseR1-QwQ-R1-TinyR1-32B

33B • Updated Mar 7 • 5 • 1

AALF/FuseR1-QwQ-R1-LightR1-32B

33B • Updated Mar 7 • 5

AALF/FuseR1-QwQ-R1-32B

33B • Updated Mar 7 • 5

AALF/FuseR1-QwQ-R1-LightR1-TinyR1-32B

33B • Updated Mar 7 • 5

AALF/gemma-2-27b-it-SimPO-37K

Text Generation • 27B • Updated Dec 18, 2024 • 701 • 18

AALF/gemma-2-27b-it-SimPO-37K-100steps

Text Generation • 27B • Updated Dec 18, 2024 • 1.04k • 12

AALF/llama-3-8b-Instruct-simpo-beta10-gamma3-lr1e-6

8B • Updated Aug 16, 2024 • 4