LLM evals and benchmark datasets
updated
Viewer
•
Updated
•
8.11k
•
10.5k
•
87
Viewer
•
Updated
•
164
•
101k
•
277
Viewer
•
Updated
•
541
•
13.2k
•
55
Viewer
•
Updated
•
7.79k
•
270k
•
171
Updated
•
190k
•
61
Viewer
•
Updated
•
12.1k
•
41.9k
•
325
Viewer
•
Updated
•
231k
•
136k
•
401
Viewer
•
Updated
•
1.63k
•
33.8k
•
224
Viewer
•
Updated
•
17.6k
•
352k
•
600
Viewer
•
Updated
•
60k
•
259k
•
110
Updated
•
23.9k
•
54
HuggingFaceH4/mt_bench_prompts
Viewer
•
Updated
•
80
•
240
•
17
Viewer
•
Updated
•
34.6k
•
2.29k
•
108
Viewer
•
Updated
•
95.4k
•
4.48k
•
37