End of training

Files changed (4) hide show

README.md CHANGED Viewed

@@ -1,6 +1,5 @@
 ---
-license: apache-2.0
-base_model: google/flan-t5-small
 tags:
 - generated_from_trainer
 metrics:
@@ -15,14 +14,14 @@ should probably proofread and complete it, then remove this comment. -->
 # myspace
-This model is a fine-tuned version of [google/flan-t5-small](https://huggingface.co/google/flan-t5-small) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: nan
-- Rouge1: 0.0117
-- Rouge2: 0.0043
-- Rougel: 0.0114
-- Rougelsum: 0.0117
-- Gen Len: 18.5663
 ## Model description
@@ -42,8 +41,8 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 2e-05
-- train_batch_size: 4
-- eval_batch_size: 4
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
@@ -54,7 +53,7 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss | Rouge1 | Rouge2 | Rougel | Rougelsum | Gen Len |
 |:-------------:|:-----:|:----:|:---------------:|:------:|:------:|:------:|:---------:|:-------:|
-| 0.0           | 1.0   | 861  | nan             | 0.0117 | 0.0043 | 0.0114 | 0.0117    | 18.5663 |
 ### Framework versions

 ---
+base_model: d0rj/rut5-base-summ
 tags:
 - generated_from_trainer
 metrics:
 # myspace
+This model is a fine-tuned version of [d0rj/rut5-base-summ](https://huggingface.co/d0rj/rut5-base-summ) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 1.9404
+- Rouge1: 0.29
+- Rouge2: 0.1344
+- Rougel: 0.2793
+- Rougelsum: 0.2798
+- Gen Len: 80.3965
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 2e-05
+- train_batch_size: 1
+- eval_batch_size: 1
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 | Training Loss | Epoch | Step | Validation Loss | Rouge1 | Rouge2 | Rougel | Rougelsum | Gen Len |
 |:-------------:|:-----:|:----:|:---------------:|:------:|:------:|:------:|:---------:|:-------:|
+| 2.1069        | 1.0   | 3444 | 1.9404          | 0.29   | 0.1344 | 0.2793 | 0.2798    | 80.3965 |
 ### Framework versions

generation_config.json CHANGED Viewed

@@ -1,6 +1,10 @@
 {
   "decoder_start_token_id": 0,
-  "eos_token_id": 1,
   "pad_token_id": 0,
   "transformers_version": "4.35.2"
 }

 {
   "decoder_start_token_id": 0,
+  "eos_token_id": 2,
+  "length_penalty": 0.6,
+  "max_length": 256,
+  "no_repeat_ngram_size": 2,
+  "num_beams": 10,
   "pad_token_id": 0,
   "transformers_version": "4.35.2"
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:dbfbfb517f9679dc1b12cd63841e10502552c7bc932956a70d8cc4cf8e2a5a12
 size 891644712

 version https://git-lfs.github.com/spec/v1
+oid sha256:5f8a7ba8001a2ff543ff5d97e3c15ba56b41fe8e583235c50e1b6c38ff03b23a
 size 891644712

runs/Dec09_19-18-26_b937ba0803e6/events.out.tfevents.1702149507.b937ba0803e6.2305.2 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ab3ff2f873ae3a375c68c37100cb03b67d598bed48d12b09ad6a6074d3d18eb3
-size 6261

 version https://git-lfs.github.com/spec/v1
+oid sha256:8a57e2da6c4d59715b9d70ed2add85023e34fb2c2e003f6887954d1f12e6ab94
+size 7140