dctanner
/

sablo-pebble-mistral-dpo-lora-HelpSteer_binarized

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

sablo-pebble-mistral-dpo-lora-HelpSteer_binarized

1 contributor

History: 14 commits

dctanner's picture

Training in progress, step 100

d6f96a3 verified 11 months ago

runs
Training in progress, step 100 11 months ago
.gitattributes

1.52 kB

initial commit 11 months ago
README.md

3.05 kB

End of training 11 months ago
adapter_config.json

656 Bytes

Training in progress, step 100 11 months ago
adapter_model.safetensors

83.9 MB
LFS

Training in progress, step 100 11 months ago
added_tokens.json

51 Bytes

Training in progress, step 100 11 months ago
all_results.json

742 Bytes

Model save 11 months ago
config.json

642 Bytes

End of training 11 months ago
eval_results.json

568 Bytes

Model save 11 months ago
special_tokens_map.json

557 Bytes

Training in progress, step 100 11 months ago
tokenizer.json

1.8 MB

Training in progress, step 100 11 months ago
tokenizer.model

493 kB
LFS

Training in progress, step 100 11 months ago
tokenizer_config.json

1.67 kB

Training in progress, step 100 11 months ago
train_results.json

194 Bytes

Model save 11 months ago
trainer_state.json

52.3 kB

Model save 11 months ago
training_args.bin
Detected Pickle imports (8)
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.trainer_utils.SchedulerType",
- "alignment.configs.DPOConfig",
- "transformers.trainer_utils.IntervalStrategy",
- "transformers.trainer_utils.HubStrategy",
- "accelerate.state.PartialState",
- "torch.device",
- "transformers.training_args.OptimizerNames"
How to fix it?
4.54 kB
LFS

Training in progress, step 100 11 months ago