WildEval

non-profit

wild_eval

WildEval

Activity Feed Request to join this org

AI & ML interests

None defined yet.

Recent Activity

valpy authored a paper 8 days ago

2 OLMo 2 Furious

valpy authored a paper 8 days ago

IssueBench: Millions of Realistic Prompts for Measuring Issue Bias in LLM Writing Assistance

valpy authored a paper 8 days ago

RewardBench 2: Advancing Reward Model Evaluation

View all activity

WildEval 's Spaces 1

Zebra Logic Bench

Explore and evaluate Zebra Logic models