Evaluation datasets

community

Activity Feed

AI & ML interests

None defined yet.

Recent Activity

SaylorTwift updated a dataset 4 days ago

lighteval/logiqa_harness

SaylorTwift new activity 4 days ago

lighteval/sacrebleu_manual:Convert dataset to Parquet

SaylorTwift updated a dataset 4 days ago

lighteval/sacrebleu_manual

View all activity

Collections 9

View 9 collections

models 1

lighteval/different-chat-templates-per-revision

Updated May 15

datasets 192

Evaluation datasets

AI & ML interests

Recent Activity

Collections 9

lighteval/RULER-262144-SmolLM3-11T-32k-v1-remote-code

lighteval/RULER-131072-SmolLM3-11T-32k-v1-remote-code

lighteval/RULER-65536-SmolLM3-11T-32k-v1-remote-code

lighteval/RULER-32768-SmolLM3-11T-32k-v1-remote-code

lighteval/RULER-262144-gemma3-instruct

lighteval/RULER-131072-gemma3-instruct

lighteval/RULER-65536-gemma3-instruct

lighteval/RULER-32768-gemma3-instruct

lighteval/RULER-262144-SmolLM3-11T-32k-v1-remote-code

lighteval/RULER-131072-SmolLM3-11T-32k-v1-remote-code

lighteval/RULER-65536-SmolLM3-11T-32k-v1-remote-code

lighteval/RULER-32768-SmolLM3-11T-32k-v1-remote-code

lighteval/RULER-262144-gemma3-instruct

lighteval/RULER-131072-gemma3-instruct

lighteval/RULER-65536-gemma3-instruct

lighteval/RULER-32768-gemma3-instruct

models 1

lighteval/different-chat-templates-per-revision

datasets 192

lighteval/logiqa_harness

lighteval/sacrebleu_manual

lighteval/lextreme

lighteval/bbh

lighteval/synthetic_reasoning

lighteval/covid_dialogue

lighteval/numeracy

lighteval/synthetic_reasoning_natural

lighteval/hendrycks_ethics

lighteval/civil_comments_helm

AI & ML interests

Recent Activity

Team members 8

Collections 9

models 1

datasets 192 Sort: Recently updated

datasets 192