Harshit Sikchi's picture

1 2 1

Harshit Sikchi

hsikchi

·

AI & ML interests

None yet

Organizations

Papers 5

arxiv:2412.05718

arxiv:2406.02900

arxiv:2311.02013

arxiv:2310.13639

models 36

hsikchi/pythia-6.9b-goldrm_tldr-dpo-beta-0.0175-alpha-0-step-79872

Text Generation • Updated May 18, 2024 • 11

hsikchi/pythia-6.9b-goldrm_tldr-dpo-beta-0.0175-alpha-0-step-59904

Text Generation • Updated May 18, 2024 • 9

hsikchi/pythia-6.9b-goldrm_tldr-dpo-beta-0.0175-alpha-0-step-19968

Text Generation • Updated May 18, 2024 • 8

hsikchi/pythia-6.9b-goldrm_tldr-dpo-beta-0.0375-alpha-0-step-59904

Text Generation • Updated May 18, 2024 • 11

hsikchi/pythia-6.9b-goldrm_tldr-dpo-beta-0.0375-alpha-0-step-39936

Text Generation • Updated May 18, 2024 • 8

hsikchi/pythia-6.9b-goldrm_tldr-dpo-beta-0.0375-alpha-0-step-79872

Text Generation • Updated May 18, 2024 • 9

hsikchi/pythia-6.9b-goldrm_tldr-dpo-beta-0.0175-alpha-0-step-39936

Text Generation • Updated May 18, 2024 • 9

hsikchi/pythia-6.9b-goldrm_tldr-dpo-beta-0.0175-alpha-0-LATEST

Text Generation • Updated May 18, 2024 • 8

hsikchi/pythia-6.9b-goldrm_tldr-dpo-beta-0.0375-alpha-0-step-19968

Text Generation • Updated May 18, 2024 • 9

hsikchi/pythia-6.9b-goldrm_tldr-dpo-beta-0.025-alpha-0-step-59904

Text Generation • Updated May 18, 2024 • 8

datasets 1

hsikchi/tldr-preference-trl-style

Viewer • Updated Apr 12, 2024 • 179k • 107