File size: 667 Bytes
cd6784a
2d3f2d0
 
 
 
 
 
cd6784a
2d3f2d0
 
 
 
 
 
 
 
 
 
 
 
 
 
86cc9bf
2d3f2d0
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
---
license:
- apache-2.0
language:
- ko
- en
pipeline_tag: text-generation
---
# **ko-wand-136M**

**ko-wand-136M**는 [**insturctkr**](https://instruct.kr)에서 사전학습한 SLM입니다.

# Model Description
[maywell/korean_textbooks](https://huggingface.co/datasets/maywell/korean_textbooks)와 한국어 말뭉치를 이용하여 사전학습 되었습니다.

## Model Info

미스트랄 아키텍쳐를 기반으로 완전히 랜덤 가중치를 시작으로 사전학습 된 모델입니다. Instruction 튜닝되지 않았습니다.

## Training Details
| Batch Size | Token Seen | lr |
|---|---|---|
| 1024 | 2.5B | 2e-3 (cosine)|

## License
apache-2.0