eenzeenee
/

t5-base-korean-summarization

text2text-generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

eenzeenee commited on Jan 17, 2023

Commit

442879a

·

1 Parent(s): fc3331d

Update README.md

add training args

Files changed (1) hide show

README.md +17 -0

README.md CHANGED Viewed

@@ -9,6 +9,7 @@ tags:
 # t5-base-korean-summarization
 This is [T5](https://huggingface.co/docs/transformers/model_doc/t5) model for korean text summarization.
 Finetuned with 3 datasets. Specifically, it is described below.
 - [Korean Paper Summarization Dataset(논문자료 요약)](https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=realm&dataSetSn=90)
@@ -81,6 +82,22 @@ RESULT >> 국어 여행을 떠나기 전에 국어 여행을 떠날 준비물과
 # Training
 # Model Architecture
 ```

 # t5-base-korean-summarization
 This is [T5](https://huggingface.co/docs/transformers/model_doc/t5) model for korean text summarization.
+Finetuned based on ['paust/pko-t5-base'](https://huggingface.co/paust/pko-t5-base) model.
 Finetuned with 3 datasets. Specifically, it is described below.
 - [Korean Paper Summarization Dataset(논문자료 요약)](https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=realm&dataSetSn=90)
 # Training
+The model was trained with the parameters:
+### training arguments
+```
+Seq2SeqTrainingArguments(
+    per_device_train_batch_size=8,
+    per_device_eval_batch_size=8,
+    auto_find_batch_size=False,
+    weight_decay=0.01,
+    learning_rate=4e-05,
+    lr_scheduler_type=linear,
+    num_train_epochs=3,
+    fp16=True)
+```
 # Model Architecture
 ```