lapp0
/

distily_bench_gpt2_optim_extended2

Generated from Trainer

8-bit precision

Model card Files Files and versions Metrics Training metrics Community

distily_bench_gpt2_optim_extended2

Ctrl+K

Ctrl+K

1 contributor

History: 75 commits

lapp0's picture

Training in progress, step 18000

4f34938 verified 12 months ago

optim=paged_lion_8bit
Training in progress, step 18000 12 months ago
.gitattributes

1.52 kB

initial commit 12 months ago
README.md

5.5 kB

End of training 12 months ago
config.json

1.39 kB

Training in progress, step 500 12 months ago
generation_config.json

119 Bytes

End of training 12 months ago
merges.txt

456 kB

Training in progress, step 500 12 months ago
model.safetensors

249 MB
LFS

Training in progress, step 18000 12 months ago
special_tokens_map.json

131 Bytes

Training in progress, step 500 12 months ago
tokenizer.json

2.11 MB

Training in progress, step 500 12 months ago
tokenizer_config.json

476 Bytes

Training in progress, step 500 12 months ago
training_args.bin
Detected Pickle imports (17)
- "accelerate.utils.dataclasses.DistributedType",
- "distily.metrics.PerplexityEvalCallback",
- "torch._utils._rebuild_tensor_v2",
- "transformers.trainer_utils.SchedulerType",
- "transformers.tokenization_utils_base.BatchEncoding",
- "transformers.trainer_utils.IntervalStrategy",
- "transformers.training_args.OptimizerNames",
- "torch.device",
- "accelerate.state.PartialState",
- "collections.OrderedDict",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "_codecs.encode",
- "distily.args.DistillationTrainingArguments",
- "tokenizers.Encoding",
- "transformers.trainer_utils.HubStrategy",
- "torch.LongStorage",
- "__builtin__.getattr"
How to fix it?
907 MB
LFS

Training in progress, step 500 12 months ago
vocab.json

798 kB

Training in progress, step 500 12 months ago