Spaces:

Dovakiins
/

qwerrwe

Build error

App Files Files Community

qwerrwe / src /axolotl /utils

Ctrl+K

Ctrl+K

100 contributors

History: 525 commits

JohanWork

ADD: warning hub model (#1301)

601c08b unverified over 1 year ago

callbacks
Update SaveAxolotlConfigtoWandBCallback to use artifact instead of save (#1483) over 1 year ago
config
ADD: warning hub model (#1301) over 1 year ago
data
wrap prepared_ds_path in str() to avoid TypeError in fsspec package (#1548) over 1 year ago
gradient_checkpointing
Unsloth gradient checkpointing offload (#1528) over 1 year ago
samplers
support for true batches with multipack (#1230) over 1 year ago
__init__.py

136 Bytes

WIP: Support table logging for mlflow, too (#1506) over 1 year ago
bench.py

2.44 kB

FDSP + QLoRA (#1378) over 1 year ago
chat_templates.py

3.62 kB

add support for cohere chat template (#1478) over 1 year ago
collators.py

9.78 kB

Pretrain multipack v2 (#1470) over 1 year ago
dict.py

327 Bytes

Pydantic 2.x cfg (#1239) over 1 year ago
distributed.py

7.14 kB

DBRX Model Support (#1462) over 1 year ago
freeze.py

8.33 kB

ORPO (#1419) over 1 year ago
lora_embeddings.py

375 Bytes

Phi2 multipack (#1173) over 1 year ago
mlflow_.py

543 Bytes

ADD: push checkpoints to mlflow artifact registry (#1295) [skip ci] over 1 year ago
model_shard_quant.py

8.95 kB

DBRX Model Support (#1462) over 1 year ago
models.py

37.6 kB

make sure everything stays in the same dtype when using dpo + FSDP (#1559) over 1 year ago
schedulers.py

7.66 kB

Scheduler implementation of Continual Pre-Training of Large Language Models: How to (re)warm your model? (#1273) over 1 year ago
tokenization.py

5.16 kB

Add debug option for RL dataset preprocessing (#1404) over 1 year ago
trainer.py

16.4 kB

PoSE context length ext (#1567) over 1 year ago
wandb_.py

609 Bytes

Feat(wandb): Refactor to be more flexible (#767) over 1 year ago