Spaces:
Duplicated from datalawyer/legal_pt_llm_leaderboard

eduagarcia
/

open_pt_llm_leaderboard

Running on CPU Upgrade

App Files Files Community

open_pt_llm_leaderboard / src

Commit History

fix enum value

e2369db

eduagarcia commited on Aug 11, 2024

fix ModelType is not defined

67c432c

eduagarcia commited on Aug 10, 2024

change 'proprietary' models to 'external' models and added news models

91c6e89

eduagarcia commited on Aug 10, 2024

update ranges

5651102
verified

eduagarcia commited on Jun 13, 2024

filter quantized models from the collection

ab44cd6
verified

eduagarcia commited on May 29, 2024

Update src/leaderboard/read_evals.py

09cd30b
verified

eduagarcia commited on May 27, 2024

Update src/tools/plots.py

0e84464
verified

eduagarcia commited on May 2, 2024

Update src/envs.py

246795a
verified

eduagarcia commited on Apr 25, 2024

Update src/envs.py

d6353b5
verified

eduagarcia commited on Apr 25, 2024

update collection format

9c5c692

eduagarcia commited on Apr 24, 2024

Update src/display/about.py

183ec61
verified

eduagarcia commited on Apr 23, 2024

Merge branch 'main' of https://huggingface.co/spaces/eduagarcia/open_pt_llm_leaderboard

dffeeb0

eduagarcia commited on Apr 21, 2024

Make model text exibit precision if there's more than one eval or precision is not float16 or bfloat16

59399bc

eduagarcia commited on Apr 21, 2024

Update src/submission/submit.py

ddc78ea
verified

eduagarcia commited on Apr 21, 2024

fix eval_name for non main revision models

4717ca8

eduagarcia commited on Apr 21, 2024

fix typo and multiple models in README

b4fc70b

eduagarcia commited on Apr 21, 2024

Merge branch 'main' of https://huggingface.co/spaces/eduagarcia/open_pt_llm_leaderboard

f49e1e5

eduagarcia commited on Apr 21, 2024

Permit different revision

a3b0a0f

eduagarcia commited on Apr 21, 2024

Update src/display/about.py

77a5f61
verified

eduagarcia commited on Apr 17, 2024

better explation for use_remote_code=True

a761927

eduagarcia commited on Apr 15, 2024

add citations

c14ac9f

eduagarcia commited on Apr 15, 2024

Add proprietary model results v1

1dbfacb

eduagarcia commited on Apr 15, 2024

manual create request

6db2f85

eduagarcia commited on Apr 15, 2024

Fix num_parameters in some models

0c95be4

eduagarcia commited on Apr 15, 2024

Change language dropdown order

1ec02f0

eduagarcia commited on Apr 3, 2024

Update model list in README

2331e6f

eduagarcia commited on Apr 3, 2024

Add new column: Main Language

6da7311

eduagarcia commited on Apr 3, 2024

change name

88675db

eduagarcia commited on Mar 20, 2024

Rename 85B+ format to 100B+

73d86a6
verified

eduagarcia commited on Mar 4, 2024

add dynamic documentation for RAW_RESULTS_REPO

43c2b1a

eduagarcia commited on Feb 22, 2024

Add raw results links if exists, and fix minor issues

aa7060a

eduagarcia commited on Feb 22, 2024

new size intervals and apply same intervals for the collection

7625ef6

eduagarcia commited on Feb 22, 2024

fix typo

5ab1da9

eduagarcia commited on Feb 21, 2024

add env variables: REQUIRE_MODEL_CARD and REQUIRE_MODEL_LICENSE

de3b367

eduagarcia commited on Feb 21, 2024

Merge branch 'main' of https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard into merge_original

811ded7

eduagarcia commited on Feb 21, 2024

submit ident json

f3a1876

eduagarcia commited on Feb 21, 2024

Add env variable SHOW_INCOMPLETE_EVALS and order evaluation queue by priority

8aaf0e7

eduagarcia commited on Feb 21, 2024

should fix the problem with flagsrm create_request_file.py

a4c11b8

Clémentine commited on Feb 21, 2024

einops as requirement

0cc3edb

eduagarcia commited on Feb 21, 2024

Allow old model metrics

6269bd0

eduagarcia commited on Feb 17, 2024

Add NPM field

f976f1c

eduagarcia commited on Feb 16, 2024

Add new tasks and make leadboard work without new tasks evals

5639a81

eduagarcia commited on Feb 16, 2024

add datasources links on the about page

03f7287

eduagarcia commited on Feb 16, 2024

fix bool env variabled

b81a33b

eduagarcia commited on Feb 15, 2024

fix eval time plot

0cb9327

eduagarcia commited on Feb 15, 2024

add changelog tab

b74e881

eduagarcia commited on Feb 15, 2024

Better about's

67cd6fc

eduagarcia commited on Feb 15, 2024

Tweak description of TruthfulQA in About (#599)

b6f02e1
verified

clefourrier HF staff

lewtun HF staff commited on Feb 14, 2024

update plot to only look at correct models

dbb8b5d

Clémentine commited on Feb 14, 2024

support hf leaderboard format and my format

a69553b

eduagarcia commited on Feb 6, 2024