Update README.md
Browse files
README.md
CHANGED
@@ -1,6 +1,28 @@
|
|
1 |
---
|
2 |
license: apache-2.0
|
3 |
-
|
4 |
-
-
|
5 |
-
|
6 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
---
|
2 |
license: apache-2.0
|
3 |
+
tags:
|
4 |
+
- gguf
|
5 |
+
- llama.cpp
|
6 |
+
- Qwen
|
7 |
+
- 한국어
|
8 |
+
---
|
9 |
+
|
10 |
+
# Qwen3 0.6B - GGUF 포맷 (float16)
|
11 |
+
|
12 |
+
이 저장소는 [Qwen3 0.6B](https://huggingface.co/Qwen/Qwen1.5-0.5B) 모델을 [`llama.cpp`](https://github.com/ggerganov/llama.cpp)의 변환 도구를 사용하여 GGUF 포맷으로 변환한 버전입니다. 이 포맷은 `llama.cpp`, `llamafile`, `llm`, `text-generation-webui` 등에서 사용할 수 있습니다.
|
13 |
+
|
14 |
+
## 🔧 변환 정보
|
15 |
+
|
16 |
+
- 변환 스크립트: `llama.cpp/convert.py`
|
17 |
+
- 출력 형식: `GGUF` (`--outtype f16`)
|
18 |
+
- 모델 크기: 0.6B 파라미터
|
19 |
+
- 원본 모델: `Qwen/Qwen1.5-0.5B`
|
20 |
+
|
21 |
+
## 🧠 모델 구조
|
22 |
+
|
23 |
+
Qwen3 계열은 Transformer 기반 언어 모델로, 다양한 언어와 작업에 사용할 수 있습니다. 본 모델은 **한국어 지원 여부에 따라 사용자가 실험적으로 확인**해 보시는 것을 권장합니다.
|
24 |
+
|
25 |
+
## 🧪 예시 사용법 (`llama.cpp`)
|
26 |
+
|
27 |
+
```bash
|
28 |
+
./main -m qwen3-0.6b.gguf -p "안녕하세요. 자기소개를 해 주세요."
|