metadata
language: ko
license: apache-2.0
hyunwoo3235/t5-v1_1-base-ko
Google's T5 Version 1.1 that trained on korean corpus
t5-v1_1-base-ko์ ํ๊ตญ์ด ์ฝํผ์ค์์ ํ์ต๋ t5 v1.1 ๋ชจ๋ธ์ ๋๋ค.
OOV์ ๋ง๊ธฐ ์ํด BBPE๋ฅผ ์ฌ์ฉํ์์ผ๋ฉฐ, HyperCLOVA์์ ํํ์ ๋ถ์์ด ์ฑ๋ฅ์ ๋ํ๋๋ฐ ๋์์ด ๋๋ ๊ฒ์ ๋ณด๊ณ ํ ํฌ๋์ด์ ํ์ต ๊ณผ์ ์์ MeCab์ ์ด์ฉํด ํํ์๊ฐ ์ด์ํ๊ฒ ํ ํฐํ ๋์ง ์๋๋ก ํ์์ต๋๋ค.
Usage
from transformers import AutoTokenizer, T5ForConditionalGeneration
tokenizer = AutoTokenizer.from_pretrained('hyunwoo3235/t5-v1_1-base-ko')
model = T5ForConditionalGeneration.from_pretrained('hyunwoo3235/t5-v1_1-base-ko')