PKU-Alignment

university

https://github.com/PKU-Alignment

PKU-Alignment

Activity Feed

AI & ML interests

Reinforcement Learning, Large Language Models, Value Alignment

Recent Activity

XuyaoWang published a dataset about 17 hours ago

PKU-Alignment/s1-m_beta

XuyaoWang updated a dataset about 17 hours ago

PKU-Alignment/s1-m_beta

XuyaoWang updated a model about 17 hours ago

PKU-Alignment/s1-m_7b_beta

View all activity

PKU-Alignment's activity

XuyaoWang

published a dataset about 17 hours ago

PKU-Alignment/s1-m_beta

Preview • Updated about 17 hours ago • 13

XuyaoWang

updated a dataset about 17 hours ago

PKU-Alignment/s1-m_beta

Preview • Updated about 17 hours ago • 13

XuyaoWang

updated a model about 17 hours ago

PKU-Alignment/s1-m_7b_beta

Image-Text-to-Text • Updated about 17 hours ago • 3

XuyaoWang

published a model about 21 hours ago

PKU-Alignment/s1-m_7b_beta

Image-Text-to-Text • Updated about 17 hours ago • 3

alignmentforever

updated a dataset 6 days ago

PKU-Alignment/align-anything

Viewer • Updated 6 days ago • 69.4k • 6.54k • 29

Repoaner

updated a dataset 11 days ago

PKU-Alignment/BeaverTails-V

Viewer • Updated 11 days ago • 30.4k • 1.01k • 1

Repoaner

published 2 datasets about 1 month ago

PKU-Alignment/MM-SafetyBench

Viewer • Updated Sep 19, 2024 • 6.72k • 1.58k • 1

PKU-Alignment/BeaverTails-V

Viewer • Updated 11 days ago • 30.4k • 1.01k • 1

Gaie

updated a dataset about 1 month ago

PKU-Alignment/Flames-1k-Chinese

Viewer • Updated Feb 7 • 2k • 341 • 1

XuyaoWang

updated a dataset about 1 month ago

PKU-Alignment/Flames-1k-Chinese

Viewer • Updated Feb 7 • 2k • 341 • 1

jijiaming

authored a paper 8 months ago

ProgressGym: Alignment with a Millennium of Moral Progress

Paper • 2406.20087 • Published Jun 28, 2024 • 4

TianyiQ

authored 5 papers 9 months ago

XuehaiPan

authored a paper over 1 year ago

BeaverTails: Towards Improved Safety Alignment of LLM via a Human-Preference Dataset

Paper • 2307.04657 • Published Jul 10, 2023 • 6

calico-1226

authored a paper over 1 year ago

Safe RLHF: Safe Reinforcement Learning from Human Feedback

Paper • 2310.12773 • Published Oct 19, 2023 • 28

jijiaming

authored a paper over 1 year ago

Safe RLHF: Safe Reinforcement Learning from Human Feedback

Paper • 2310.12773 • Published Oct 19, 2023 • 28

XuehaiPan

authored a paper over 1 year ago

Safe RLHF: Safe Reinforcement Learning from Human Feedback

Paper • 2310.12773 • Published Oct 19, 2023 • 28

AI & ML interests

Recent Activity

Team members 16

PKU-Alignment's activity