Update README.md
Browse files
README.md
CHANGED
@@ -12,14 +12,25 @@ CPT模型论文:CPT: A Pre-Trained Unbalanced Transformer for Both Chinese Lan
|
|
12 |
|
13 |
模型相关配置文件均为模型训练后生成保存的,各文件介绍如下:
|
14 |
1.all_results.json:包括训练epoch、train_loss、train_time等训练最终数据。
|
|
|
15 |
2.cmd.txt:模型训练过程的cmd命令行输出结果,可以详细的看到模型的训练过程。
|
|
|
16 |
3.config.json:包括activation_function、architectures、encoder_layers、tokenizer_class等模型超参数信息。
|
|
|
17 |
4.generation_config.json:用于生成反馈的相关参数。
|
|
|
18 |
5.model.safetensors:模型参数配置文件,可用于调用模型。
|
|
|
19 |
6.special_tokens_map.json:[CLS]、[EOS]等特殊字符说明。
|
|
|
20 |
7.test_generations.txt:模型在test测试集上的输出结果,测试集共1100个数据,因此共有1100个文本反馈。
|
|
|
21 |
8.tokenizer_config.json:模型tokenizer相关信息。
|
|
|
22 |
9.train_results.json:与all_results.json相同。
|
|
|
23 |
10.train_state.json:详细记录了每轮训练时的相关信息。
|
|
|
24 |
11.training_args.bin:训练相关参数信息。
|
|
|
25 |
12.vocab.txt:模型训练的词汇表,用于将token解码为人可以看懂的文字。相当于一个映射表,起到译码映射的作用。
|
|
|
12 |
|
13 |
模型相关配置文件均为模型训练后生成保存的,各文件介绍如下:
|
14 |
1.all_results.json:包括训练epoch、train_loss、train_time等训练最终数据。
|
15 |
+
|
16 |
2.cmd.txt:模型训练过程的cmd命令行输出结果,可以详细的看到模型的训练过程。
|
17 |
+
|
18 |
3.config.json:包括activation_function、architectures、encoder_layers、tokenizer_class等模型超参数信息。
|
19 |
+
|
20 |
4.generation_config.json:用于生成反馈的相关参数。
|
21 |
+
|
22 |
5.model.safetensors:模型参数配置文件,可用于调用模型。
|
23 |
+
|
24 |
6.special_tokens_map.json:[CLS]、[EOS]等特殊字符说明。
|
25 |
+
|
26 |
7.test_generations.txt:模型在test测试集上的输出结果,测试集共1100个数据,因此共有1100个文本反馈。
|
27 |
+
|
28 |
8.tokenizer_config.json:模型tokenizer相关信息。
|
29 |
+
|
30 |
9.train_results.json:与all_results.json相同。
|
31 |
+
|
32 |
10.train_state.json:详细记录了每轮训练时的相关信息。
|
33 |
+
|
34 |
11.training_args.bin:训练相关参数信息。
|
35 |
+
|
36 |
12.vocab.txt:模型训练的词汇表,用于将token解码为人可以看懂的文字。相当于一个映射表,起到译码映射的作用。
|