jaong commited on
Commit
429f84f
·
verified ·
1 Parent(s): 2c43a35

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +11 -0
README.md CHANGED
@@ -12,14 +12,25 @@ CPT模型论文:CPT: A Pre-Trained Unbalanced Transformer for Both Chinese Lan
12
 
13
  模型相关配置文件均为模型训练后生成保存的,各文件介绍如下:
14
  1.all_results.json:包括训练epoch、train_loss、train_time等训练最终数据。
 
15
  2.cmd.txt:模型训练过程的cmd命令行输出结果,可以详细的看到模型的训练过程。
 
16
  3.config.json:包括activation_function、architectures、encoder_layers、tokenizer_class等模型超参数信息。
 
17
  4.generation_config.json:用于生成反馈的相关参数。
 
18
  5.model.safetensors:模型参数配置文件,可用于调用模型。
 
19
  6.special_tokens_map.json:[CLS]、[EOS]等特殊字符说明。
 
20
  7.test_generations.txt:模型在test测试集上的输出结果,测试集共1100个数据,因此共有1100个文本反馈。
 
21
  8.tokenizer_config.json:模型tokenizer相关信息。
 
22
  9.train_results.json:与all_results.json相同。
 
23
  10.train_state.json:详细记录了每轮训练时的相关信息。
 
24
  11.training_args.bin:训练相关参数信息。
 
25
  12.vocab.txt:模型训练的词汇表,用于将token解码为人可以看懂的文字。相当于一个映射表,起到译码映射的作用。
 
12
 
13
  模型相关配置文件均为模型训练后生成保存的,各文件介绍如下:
14
  1.all_results.json:包括训练epoch、train_loss、train_time等训练最终数据。
15
+
16
  2.cmd.txt:模型训练过程的cmd命令行输出结果,可以详细的看到模型的训练过程。
17
+
18
  3.config.json:包括activation_function、architectures、encoder_layers、tokenizer_class等模型超参数信息。
19
+
20
  4.generation_config.json:用于生成反馈的相关参数。
21
+
22
  5.model.safetensors:模型参数配置文件,可用于调用模型。
23
+
24
  6.special_tokens_map.json:[CLS]、[EOS]等特殊字符说明。
25
+
26
  7.test_generations.txt:模型在test测试集上的输出结果,测试集共1100个数据,因此共有1100个文本反馈。
27
+
28
  8.tokenizer_config.json:模型tokenizer相关信息。
29
+
30
  9.train_results.json:与all_results.json相同。
31
+
32
  10.train_state.json:详细记录了每轮训练时的相关信息。
33
+
34
  11.training_args.bin:训练相关参数信息。
35
+
36
  12.vocab.txt:模型训练的词汇表,用于将token解码为人可以看懂的文字。相当于一个映射表,起到译码映射的作用。