shorecode
/

t5-efficient-tiny-summarizer-general-purpose

Text2Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Metrics Training metrics Community

shorecode commited on Dec 10, 2024

Commit

ee69ad7

·

verified ·

1 Parent(s): f7984bd

Training complete!

Files changed (3) hide show

README.md +8 -10
model.safetensors +1 -1
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -16,7 +16,12 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [google/t5-efficient-tiny-nh8](https://huggingface.co/google/t5-efficient-tiny-nh8) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 3.8741
 ## Model description
@@ -36,21 +41,14 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 7.000000000000001e-05
-- train_batch_size: 50
-- eval_batch_size: 50
 - seed: 42
 - optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - num_epochs: 3
 - mixed_precision_training: Native AMP
-### Training results
-| Training Loss | Epoch | Step | Validation Loss |
-|:-------------:|:-----:|:----:|:---------------:|
-| 4.3365        | 2.5   | 200  | 3.8741          |
 ### Framework versions
 - Transformers 4.47.0

 This model is a fine-tuned version of [google/t5-efficient-tiny-nh8](https://huggingface.co/google/t5-efficient-tiny-nh8) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- eval_loss: 4.7168
+- eval_model_preparation_time: 0.0032
+- eval_runtime: 23.0401
+- eval_samples_per_second: 347.612
+- eval_steps_per_second: 4.991
+- step: 0
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 7.000000000000001e-05
+- train_batch_size: 70
+- eval_batch_size: 70
 - seed: 42
 - optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - num_epochs: 3
 - mixed_precision_training: Native AMP
 ### Framework versions
 - Transformers 4.47.0

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:32d2c74aa61047ec79b33a0624c061d736c60f81f92dd06bec96522458271259
 size 62293080

 version https://git-lfs.github.com/spec/v1
+oid sha256:1a2de4de5443fa966efc402c8dfda08d1bedfae86be35b1f616a60ad28e7a990
 size 62293080

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f721dd7c177c395969980c852b91bcf9a8013cd375af2d1a26b3ec20012eb08f
 size 5304

 version https://git-lfs.github.com/spec/v1
+oid sha256:639965cd1c0265d0ae1ef8aafaa8aec94659deccc7dbe06d4dc3452d468701c7
 size 5304