metadata
license:
- apache-2.0
language:
- ko
- en
pipeline_tag: text-generation
ko-wand-136M
ko-wand-136M는 insturctkr에서 사전학습한 SLM입니다.
Model Description
maywell/korean_textbooks와 한국어 말뭉치를 이용하여 사전학습 되었습니다.
Model Info
미스트랄 아키텍쳐를 기반으로 완전히 랜덤 가중치를 시작으로 사전학습 된 모델입니다. Instruction 튜닝되지 않았습니다.
Training Details
Batch Size | Token Seen | lr |
---|---|---|
1024 | 2.5B | 2e-3 (cosine) |
License
apache-2.0