Cornell-AGI

university

Activity Feed

AI & ML interests

Reinforcement Learning from Human Feedback

Recent Activity

GitBag updated a dataset 22 days ago

Cornell-AGI/amazon_movie_tv_item_mxbai

GitBag updated a dataset 2 months ago

Cornell-AGI/amazon_movie_tv_llama_mxbai

GitBag authored a paper 3 months ago

Reviewer2: Optimizing Review Generation Through Prompt Generation

View all activity

Organization Card

Community About org cards

Collections 2

models 8

datasets 9

Cornell-AGI/amazon_movie_tv_item_mxbai

Viewer • Updated 22 days ago • 10.5k • 520

Cornell-AGI/amazon_movie_tv_llama_mxbai

Viewer • Updated Oct 23 • 17.1k • 52

Cornell-AGI/REFUEL-Ultrainteract-Llama-3-Armo-iter_2

Viewer • Updated Oct 8 • 116k • 52 • 1

Cornell-AGI/REFUEL-Ultrainteract-Llama-3-Armo-iter_1

Viewer • Updated Oct 8 • 64.6k • 38

Cornell-AGI/REFUEL-UltraInteract-setting-two

Viewer • Updated Oct 5 • 106k • 89

Cornell-AGI/REFUEL-hh-setting-two

Viewer • Updated Oct 5 • 165k • 53

Cornell-AGI/Ultrafeedback-Llama-3-Armo-iter_1

Viewer • Updated Sep 2 • 56.1k • 45

Cornell-AGI/Ultrafeedback-Llama-3-Armo-iter_3

Viewer • Updated Sep 2 • 44.6k • 40 • 1

Cornell-AGI/Ultrafeedback-Llama-3-Armo-iter_2

Viewer • Updated Sep 2 • 55.1k • 35

Cornell-AGI

AI & ML interests

Recent Activity

Collections 2

Regressing the Relative Future: Efficient Policy Optimization for Multi-turn RLHF

Cornell-AGI/REFUEL-Llama-3-Armo-iter_1

Cornell-AGI/REFUEL-Llama-3-Armo-iter_2

Cornell-AGI/REFUEL-Ultrainteract-Llama-3-Armo-iter_1

REBEL: Reinforcement Learning via Regressing Relative Rewards

Cornell-AGI/REBEL-Llama-3-Armo-iter_1

Cornell-AGI/REBEL-Llama-3-Armo-iter_2

Cornell-AGI/REBEL-Llama-3-Armo-iter_3

models 8

Cornell-AGI/REFUEL-Llama-3-Armo-iter_2

Cornell-AGI/REFUEL-Llama-3-Armo-iter_1

Cornell-AGI/REBEL-Llama-3-Armo-iter_3

Cornell-AGI/REBEL-Llama-3-Armo-iter_2

Cornell-AGI/REBEL-Llama-3-Armo-iter_1

Cornell-AGI/REBEL-Llama-3-epoch_2

Cornell-AGI/REBEL-Llama-3

Cornell-AGI/REBEL-OpenChat-3.5

datasets 9

Cornell-AGI/amazon_movie_tv_item_mxbai

Cornell-AGI/amazon_movie_tv_llama_mxbai

Cornell-AGI/REFUEL-Ultrainteract-Llama-3-Armo-iter_2

Cornell-AGI/REFUEL-Ultrainteract-Llama-3-Armo-iter_1

Cornell-AGI/REFUEL-UltraInteract-setting-two

Cornell-AGI/REFUEL-hh-setting-two

Cornell-AGI/Ultrafeedback-Llama-3-Armo-iter_1

Cornell-AGI/Ultrafeedback-Llama-3-Armo-iter_3

Cornell-AGI/Ultrafeedback-Llama-3-Armo-iter_2

AI & ML interests

Recent Activity

Team members 1

Collections 2

models 8 Sort: Recently updated

datasets 9 Sort: Recently updated

models 8

datasets 9