File size: 903 Bytes
4864c0d e115d45 4864c0d e115d45 6b34531 e115d45 913c025 e115d45 1874c1c e115d45 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 |
---
language: ko
license: apache-2.0
---
# team-lucid/t5-v1_1-base-ko
[Google's T5](https://ai.googleblog.com/2020/02/exploring-transfer-learning-with-t5.html) Version 1.1 that trained on korean corpus
t5-v1_1-base-ko์ ํ๊ตญ์ด ์ฝํผ์ค์์ ํ์ต๋ t5 v1.1 ๋ชจ๋ธ์
๋๋ค.
OOV์ ๋ง๊ธฐ ์ํด BBPE๋ฅผ ์ฌ์ฉํ์์ผ๋ฉฐ, HyperCLOVA์์ ํํ์ ๋ถ์์ด ์ฑ๋ฅ์ ๋ํ๋๋ฐ ๋์์ด ๋๋ ๊ฒ์ ๋ณด๊ณ ํ ํฌ๋์ด์ ํ์ต ๊ณผ์ ์์ MeCab์ ์ด์ฉํด ํํ์๊ฐ ์ด์ํ๊ฒ ํ ํฐํ๋์ง ์๋๋ก ํ์์ต๋๋ค.
์ด ์ฐ๊ตฌ๋ ๊ตฌ๊ธ์ TPU Research Cloud(TRC)๋ฅผ ํตํด ์ง์๋ฐ์ Cloud TPU๋ก ํ์ต๋์์ต๋๋ค.
## Usage
```python
from transformers import AutoTokenizer, T5ForConditionalGeneration
tokenizer = AutoTokenizer.from_pretrained('team-lucid/t5-v1_1-base-ko')
model = T5ForConditionalGeneration.from_pretrained('team-lucid/t5-v1_1-base-ko')
``` |