Commit
·
d2f31cd
1
Parent(s):
f5da430
Create README.md
Browse files
README.md
ADDED
@@ -0,0 +1,47 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
# 九章元识 | DataCanvas Alaya
|
2 |
+
|
3 |
+
GitHub: https://github.com/DataCanvasIO/Alaya
|
4 |
+
|
5 |
+
九章云极DataCanvas重磅发布的元识大模型Alaya,在自主整理的高品质多语言数据集上训练了1.5T+ tokens。
|
6 |
+
|
7 |
+
首先在Hugging Face开源了7B-Base和7B-Chat版本,模型表现业内领先,知识丰富且富有时效性,最新数据覆盖2023年10月的内容。Alaya-7B-Chat具备多轮对话、自我认知和偏见拒答的能力,能够完成知识问答、代码编写、信息提取、阅读理解、创意写作等多项语言任务。
|
8 |
+
|
9 |
+
|
10 |
+
### 预训练参数
|
11 |
+
训练Alaya的过程中,使用的超参如下:
|
12 |
+
| **Hidden Dimension** | 4096 |
|
13 |
+
|:------------------------------|:----------------------------------------------------------------------|
|
14 |
+
| **Number of Attention Heads** | 32 |
|
15 |
+
| **Number of Layers** | 32 |
|
16 |
+
| **Vocabulary Size** | 60160 |
|
17 |
+
| **Optimizer** | Decoupled AdamW (beta=0.9, 0.95; epsilon = 1.0e-8) |
|
18 |
+
| **Max Learning Rate** | 1.2e-4 |
|
19 |
+
| **Min Learning Rate** | 1.2e-5 |
|
20 |
+
| **Scheduler** | Cosine Decay with Warmup |
|
21 |
+
| **Weight Decay** | 1.0e-5 |
|
22 |
+
| **Gradient Clip Norm** | 0.3 |
|
23 |
+
|
24 |
+
## 声明
|
25 |
+
Alaya训练过程中已经采取多种措施进行数据的筛选与过滤,尽可能保证数据的合法合规,但由于神经网络的黑盒本质,即使训练数据相对干净,模型还是可能生成一些错误的、不可预见的或难以干预的回答。请谨慎使用!
|
26 |
+
|
27 |
+
请注意:
|
28 |
+
+ 请勿使用Alaya进行任何违反法律法规或是危害国家安全的活动
|
29 |
+
+ 请勿恶意引导Alaya生成不合适的回答
|
30 |
+
+ 请勿使用Alaya侵犯他人或团体的权益
|
31 |
+
+ Alaya生成的文本不代表训练数据一定包含该信息,且不代表九章云极的立场
|
32 |
+
|
33 |
+
对于使用模型而导致的任何问题,九章云极将不承担任何责任。
|
34 |
+
|
35 |
+
### 联系我们
|
36 |
+
如果您在使用的过程中发现任何问题,想要提供意见或建议,欢迎联系:[email protected]。
|
37 |
+
|
38 |
+
## 协议
|
39 |
+
Alaya使用<a href="https://github.com/DataCanvasIO/Alaya/blob/main/LICENSE">Apache 2.0 Lisense</a>,开放模型权重,允许商业用途。如果您的项目引用了我们的Alaya,请标明出处,可以使用以下citation:
|
40 |
+
```
|
41 |
+
@misc{datacanvas2023alaya,
|
42 |
+
author = {DataCanvas Ltd.},
|
43 |
+
title = {alaya},
|
44 |
+
year = {2023},
|
45 |
+
howpublished = {\url{https://github.com/DataCanvasIO/Alaya}},
|
46 |
+
}
|
47 |
+
```
|