distily
/

distily_smollm_dataset_sweep

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

distily_smollm_dataset_sweep

Ctrl+K

Ctrl+K

1 contributor

History: 2 commits

lapp0's picture

Training in progress, step 5000

b50f74f verified 11 months ago

logs
Training in progress, step 5000 11 months ago
.gitattributes

1.52 kB

initial commit 11 months ago
config.json

725 Bytes

Training in progress, step 5000 11 months ago
merges.txt

466 kB

Training in progress, step 5000 11 months ago
model.safetensors

326 MB
LFS

Training in progress, step 5000 11 months ago
special_tokens_map.json

863 Bytes

Training in progress, step 5000 11 months ago
tokenizer.json

2.1 MB

Training in progress, step 5000 11 months ago
tokenizer_config.json

3.69 kB

Training in progress, step 5000 11 months ago
training_args.bin
Detected Pickle imports (9)
- "transformers.trainer_utils.IntervalStrategy",
- "distily.args.DistillationTrainingArguments",
- "transformers.trainer_utils.SchedulerType",
- "accelerate.state.PartialState",
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.trainer_utils.HubStrategy",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "torch.device",
- "transformers.training_args.OptimizerNames"
How to fix it?
5.62 kB
LFS

Training in progress, step 5000 11 months ago
vocab.json

801 kB

Training in progress, step 5000 11 months ago