Update README.md
Browse files
README.md
CHANGED
@@ -19,25 +19,45 @@ tags:
|
|
19 |
- gptq
|
20 |
license: cc-by-nc-sa-4.0
|
21 |
---
|
22 |
-
|
23 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
24 |
<!-- README_GPTQ.md-provided-files start -->
|
25 |
## Provided files and GPTQ parameters
|
26 |
-
|
27 |
-
|
28 |
-
|
|
|
29 |
<details>
|
30 |
-
<summary>
|
31 |
-
|
32 |
-
-
|
33 |
-
-
|
34 |
-
-
|
35 |
-
-
|
36 |
-
-
|
37 |
-
-
|
|
|
38 |
|
39 |
</details>
|
40 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
41 |
# Original model card: Llama 2 ko 70b
|
42 |
> ๐ง Note: this repo is under construction ๐ง
|
43 |
|
@@ -167,3 +187,4 @@ Apple Sillicon does not support BF16 computing, use CPU instead. (BF16 is suppor
|
|
167 |
publisher = { Hugging Face }
|
168 |
}
|
169 |
```
|
|
|
|
19 |
- gptq
|
20 |
license: cc-by-nc-sa-4.0
|
21 |
---
|
22 |
+
|
23 |
+
# Llama-2-Ko-70b-GPTQ
|
24 |
+
- ๋ชจ๋ธ ์ ์์: [beomi](https://huggingface.co/beomi)
|
25 |
+
- ์๋ณธ ๋ชจ๋ธ: [Llama-2-ko-70b](https://huggingface.co/beomi/llama-2-ko-70b)
|
26 |
+
|
27 |
+
<!-- description start -->
|
28 |
+
## Description
|
29 |
+
|
30 |
+
์ด ๋ ํฌ๋ [Llama-2-ko-70b](https://huggingface.co/beomi/llama-2-ko-70b)์ GPTQ ๋ชจ๋ธ ํ์ผ์ ํฌํจํ๊ณ ์์ต๋๋ค.
|
31 |
+
|
32 |
+
<!-- description end -->
|
33 |
+
|
34 |
<!-- README_GPTQ.md-provided-files start -->
|
35 |
## Provided files and GPTQ parameters
|
36 |
+
ํ๋์จ์ด์ ์๊ตฌ์ฌํญ์ ๊ฐ์ฅ ์ ํฉํ ์์ํ ๋งค๊ฐ๋ณ์๋ฅผ ์ ํํ ์ ์๋๋ก ์ฌ๋ฌ ๊ฐ์ง(๊ณง) ์์ํ ๋งค๊ฐ๋ณ์๊ฐ ์ ๊ณต๋ฉ๋๋ค.
|
37 |
+
๊ฐ ์์ํ๋ ๋ค๋ฅธ ๋ธ๋์น์ ์์ต๋๋ค.
|
38 |
+
๋ชจ๋ GPTQ ์์ํ๋ AutoGPTQ๋ก ๋ง๋ค์ด์ก์ต๋๋ค.
|
39 |
+
|
40 |
<details>
|
41 |
+
<summary>GPTQ ํ๋ผ๋ฏธํฐ ์ ๋ณด</summary>
|
42 |
+
|
43 |
+
- Bits: ์์ํ๋ ๋ชจ๋ธ์ ๋นํธ ํฌ๊ธฐ์
๋๋ค.
|
44 |
+
- GS: GPTQ ๊ทธ๋ฃน ์ฌ์ด์ฆ. ์ซ์๊ฐ ๋์์๋ก VRAM์ ๋ ์ฌ์ฉํ์ง๋ง ์์ํ ์ ํ๋๊ฐ ๋ฎ์์ง๋๋ค. "None"์ ๊ฐ๋ฅํ ๊ฐ์ฅ ๋ฎ์ ๊ฐ์
๋๋ค.
|
45 |
+
- Act Order: True or False. `desc_act`์ผ๋ก๋ ์๋ ค์ ธ ์์ต๋๋ค. ์ฐธ์ด๋ฉด ์์ํ ์ ํ๋๊ฐ ํฅ์๋ฉ๋๋ค.
|
46 |
+
- Damp %: ์ํ์ด ์ ๋ํ๋ฅผ ์ํด ์ฒ๋ฆฌ๋๋ ๋ฐฉ์์ ์ํฅ์ ์ฃผ๋ GPTQ ๋งค๊ฐ๋ณ์์
๋๋ค. 0.01์ด ๊ธฐ๋ณธ๊ฐ์ด์ง๋ง 0.1์ ์ฌ์ฉํ๋ฉด ์ ํ๋๊ฐ ์ฝ๊ฐ ํฅ์๋ฉ๋๋ค.
|
47 |
+
- GPTQ dataset: ์ ๋ํ์ ์ฌ์ฉ๋๋ ๋ฐ์ดํฐ ์ธํธ์
๋๋ค. ๋ชจ๋ธ ํ์ต์ ๋ ์ ํฉํ ๋ฐ์ดํฐ ์ธํธ๋ฅผ ์ฌ์ฉํ๋ฉด ์ ๋ํ ์ ํ๋๊ฐ ํฅ์๋ ์ ์์ต๋๋ค. GPTQ ๋ฐ์ดํฐ ์ธํธ๋ ๋ชจ๋ธ ํ์ต์ ์ฌ์ฉ๋ ๋ฐ์ดํฐ ์ธํธ์ ๋์ผํ์ง ์์ผ๋ฏ๋ก ํ์ต ๋ฐ์ดํฐ ์ธํธ์ ๋ํ ์์ธํ ๋ด์ฉ์ ์๋ณธ ๋ชจ๋ธ repo๋ฅผ ์ฐธ์กฐํ์ธ์.
|
48 |
+
- Sequence Length: ์ ๋ํ์ ์ฌ์ฉ๋ ๋ฐ์ดํฐ ์ธํธ ์ํ์ค์ ๊ธธ์ด์
๋๋ค. ์ด์์ ์ผ๋ก๋ ๋ชจ๋ธ ์ํ์ค ๊ธธ์ด์ ๋์ผํฉ๋๋ค. ์ผ๋ถ ๋งค์ฐ ๊ธด ์ํ์ค ๋ชจ๋ธ(16+K)์ ๊ฒฝ์ฐ ๋ ์งง์ ์ํ์ค ๊ธธ์ด๋ฅผ ์ฌ์ฉํด์ผ ํ ์๋ ์์ต๋๋ค. ์ํ์ค ๊ธธ์ด๊ฐ ์งง๋ค๊ณ ํด์ ์์ํ๋ ๋ชจ๋ธ์ ์ํ์ค ๊ธธ์ด๊ฐ ์ ํ๋๋ ๊ฒ์ ์๋๋๋ค. ์ด๋ ๊ธด ์ถ๋ก ์ํ์ค์ ์์ํ ์ ํ๋์๋ง ์ํฅ์ ๋ฏธ์นฉ๋๋ค.
|
49 |
+
- ExLlama Compatibility: Exllama๋ก ์ด ํ์ผ์ ๋ก๋ํ ์ ์๋์ง์ ์ฌ๋ถ์ด๋ฉฐ, ํ์ฌ 4๋นํธ์ ๋ผ๋ง ๋ชจ๋ธ๋ง ์ง์ํฉ๋๋ค.
|
50 |
|
51 |
</details>
|
52 |
|
53 |
+
| Branch | Bits | GS | Act Order | Damp % | GPTQ Dataset | Seq Len | Size | ExLlama | Desc |
|
54 |
+
| ------ | ---- | -- | --------- | ------ | ------------ | ------- | ---- | ------- | ---- |
|
55 |
+
| [main](https://huggingface.co/kuotient/llama-2-ko-70b-GPTQ/tree/main) | 4 | None | Yes | 0.1 | [wikitext](https://huggingface.co/datasets/wikitext/viewer/wikitext-2-v1/test) | 4096 | 35.8 GB | Yes | 4-bit, Act Order ํฌํจ. VRAM ์ฌ์ฉ๋์ ์ค์ด๊ธฐ ์ํ group size -1. |
|
56 |
+
|
57 |
+
<!-- README_GPTQ.md-provided-files end -->
|
58 |
+
|
59 |
+
<!-- original model card start -->
|
60 |
+
|
61 |
# Original model card: Llama 2 ko 70b
|
62 |
> ๐ง Note: this repo is under construction ๐ง
|
63 |
|
|
|
187 |
publisher = { Hugging Face }
|
188 |
}
|
189 |
```
|
190 |
+
<!-- original model card end -->
|