Zhuoyang Song commited on
Commit
e2f51a0
·
1 Parent(s): 3a4a6e9

update model card

Browse files
Files changed (1) hide show
  1. README.md +29 -1
README.md CHANGED
@@ -32,7 +32,7 @@ Chinese abductive reasoning model based on Transformer-XL.
32
  * Wudao Causal Corpus (with 2.3 million samples): Based on the Wudao corpus (280G version), sentence pairs with causality were obtained through logic indicator matching, manual annotation + [GTSFactory](https://gtsfactory.com/), and data cleaning.
33
 
34
  **训练流程 Model Training**
35
- 1. 在悟道语料库(280G版本)和标注的相似句子对数据集上进行预训练([Randeng-TransformerXL-1.1B-Paraphrasing-Chinese](https://huggingface.co/IDEA-CCNL/Randeng-TransformerXL-1.1B-Paraphrasing-Chinese))
36
  2. 在1.5M因果语料上进行反绎生成任务的训练
37
  3. 基于其余0.8M因果语料,协同[Randeng-TransformerXL-5B-Deduction-Chinese](https://huggingface.co/IDEA-CCNL/Randeng-TransformerXL-5B-Deduction-Chinese)和[Erlangshen-Roberta-330M-Causal-Chinese](https://huggingface.co/IDEA-CCNL/Erlangshen-Roberta-330M-Causal-Chinese)进行Self-consistency闭环迭代训练
38
  * 两个生成模型基于核采样和贪心的方式进行因果推理和反绎推理,产生大量伪样本;
@@ -75,6 +75,34 @@ print(abduction_generate(model, tokenizer, input_text, device=0))
75
  print(abduction_generate(model, tokenizer, input_texts, device=0))
76
  ```
77
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
78
  ## 引用 Citation
79
 
80
  如果您在您的工作中使用了我们的模型,可以引用我们的[论文](https://arxiv.org/abs/2209.02970):
 
32
  * Wudao Causal Corpus (with 2.3 million samples): Based on the Wudao corpus (280G version), sentence pairs with causality were obtained through logic indicator matching, manual annotation + [GTSFactory](https://gtsfactory.com/), and data cleaning.
33
 
34
  **训练流程 Model Training**
35
+ 1. 在悟道语料库(280G版本)上进行预训练
36
  2. 在1.5M因果语料上进行反绎生成任务的训练
37
  3. 基于其余0.8M因果语料,协同[Randeng-TransformerXL-5B-Deduction-Chinese](https://huggingface.co/IDEA-CCNL/Randeng-TransformerXL-5B-Deduction-Chinese)和[Erlangshen-Roberta-330M-Causal-Chinese](https://huggingface.co/IDEA-CCNL/Erlangshen-Roberta-330M-Causal-Chinese)进行Self-consistency闭环迭代训练
38
  * 两个生成模型基于核采样和贪心的方式进行因果推理和反绎推理,产生大量伪样本;
 
75
  print(abduction_generate(model, tokenizer, input_texts, device=0))
76
  ```
77
 
78
+ ## 一些例子 Some Cases
79
+
80
+ (以下内容为模型生成,不代表本单位观点)
81
+
82
+ 1. 玉米价格持续上涨
83
+ - 玉米库存较低,需求增加
84
+ - 东北地区受降雨天气影响,玉米生长受到影响
85
+ - 今年玉米种植面积大幅度下降
86
+ 2. 玉米价格下跌
87
+ - 玉米的库存量大,需求量低
88
+ - 今年玉米产量创新高,而需求不足
89
+ - 目前玉米市场处于供大于求的状态,再加上近期华北地区遭遇了强降雨天气,玉米质量下降
90
+ 3. 农作物大量死亡
91
+ - 旱灾持续时间长,又无雨,土壤干裂,作物得不到水分
92
+ - 霜冻来临,气温骤降,植物受冻
93
+ - 许多农民为了使农作物能够长得更好,使用更多的农药,并且没有合理的休耕措施
94
+ 4. 鲸鱼需要消耗大量的能量
95
+ - 鲸鱼的体型庞大,新陈代谢速度又快
96
+ - 鲸鱼的身体结构特殊,需要消耗大量的能量来维持身体结构的稳定
97
+ 5. 实体经济融资难、融资贵
98
+ - 融资渠道单一,实体经济难以获得充足的资金
99
+ - 实体经济融资主要依赖抵押、担保、信贷等间接融资方式,存在抵押物不足、担保机制不完善等问题
100
+ - 实体经济往往需要大量的资金,而银行受制于风险控制、资本充足率等要求,很难大量发放贷款
101
+ 6. 火山爆发导致植物死亡
102
+ - 火山灰会阻碍植物吸收阳光
103
+ - 火山灰的飘散,导致植物无法吸收到足够的氧气
104
+ - 火山喷发时,岩浆温度极高,植物无法承受
105
+
106
  ## 引用 Citation
107
 
108
  如果您在您的工作中使用了我们的模型,可以引用我们的[论文](https://arxiv.org/abs/2209.02970):