ConvLab
/

gpt2-medium-nlg-sgd

Model card Files Files and versions

qpz commited on Dec 26, 2022

Commit

f6f6e81

·

1 Parent(s): a3bc9ac

Update README.md

Files changed (1) hide show

README.md +24 -3

README.md CHANGED Viewed

@@ -1,3 +1,24 @@
----
-license: apache-2.0
----

+# t5-small-nlu-tm2-context3
+This model is a fine-tuned version of [GPT2-medium](https://huggingface.co/gpt2-medium) on [Schema-Guided Dialogue](https://huggingface.co/datasets/ConvLab/sgd).
+Refer to [ConvLab-3](https://github.com/ConvLab/ConvLab-3) for model description and usage.
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 5e-5
+- train_batch_size: 64
+- gradient_accumulation_steps: 2
+- total_train_batch_size: 128
+- optimizer: AdamW
+- lr_scheduler_type: linear
+- num_epochs: 20
+### Framework versions
+- Transformers 4.23.1
+- Pytorch 1.10.1+cu111