Casually commited on
Commit
2036353
1 Parent(s): c364a38

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +128 -0
README.md CHANGED
@@ -1,3 +1,131 @@
1
  ---
2
  license: apache-2.0
 
3
  ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  ---
2
  license: apache-2.0
3
+ language: zh
4
  ---
5
+
6
+
7
+ # uie-base
8
+
9
+ ## 介绍
10
+ * **[PaddlePaddle/uie-base](https://huggingface.co/PaddlePaddle/uie-base)** 的 Pytorch 实现
11
+
12
+ ## 代码调用
13
+ ### 实体抽取
14
+
15
+ ```python
16
+ from transformers import AutoModel, AutoTokenizer
17
+ model = AutoModel.from_pretrained('Casually/uie-base', trust_remote_code=True)
18
+ model.eval().to('cuda')
19
+ tokenizer = AutoTokenizer.from_pretrained('Casually/uie-base')
20
+ schema = ['时间', '选手', '赛事名称']
21
+ res = model.predict(schema=schema,
22
+ input_texts="2月8日上午北京冬奥会自由式滑雪女子大跳台决赛中中国选手谷爱凌以188.25分获得金牌!",
23
+ tokenizer=tokenizer,
24
+ )
25
+ ```
26
+
27
+ ```ipython
28
+ >>> from pprint import pprint
29
+ >>> pprint(res)
30
+ [{'时间': [{'end': 6,
31
+ 'probability': 0.9857378532924486,
32
+ 'start': 0,
33
+ 'text': '2月8日上午'}],
34
+ '赛事名称': [{'end': 23,
35
+ 'probability': 0.8503088338956672,
36
+ 'start': 6,
37
+ 'text': '北京冬奥会自由式滑雪女子大跳台决赛'}],
38
+ '选手': [{'end': 31,
39
+ 'probability': 0.8981540953663227,
40
+ 'start': 28,
41
+ 'text': '谷爱凌'}]}]
42
+ ```
43
+
44
+
45
+
46
+ ### 关系抽取
47
+ ```python
48
+ from transformers import AutoModel, AutoTokenizer
49
+ model = AutoModel.from_pretrained('Casually/uie-base', trust_remote_code=True)
50
+ model.eval().to('cuda')
51
+ tokenizer = AutoTokenizer.from_pretrained('Casually/uie-base')
52
+ schema = {'竞赛名称': ['主办方', '承办方', '已举办次数']}
53
+ res = model.predict(schema=schema,
54
+ input_texts='2022语言与智能技术竞赛由中国中文信息学会和中国计算机学会联合主办,百度公司、中国中文信息学会评测工作委员会和中国计算机学会自然语言处理专委会承办,已连续举办4届,成为全球最热门的中文NLP赛事之一。',
55
+ tokenizer=tokenizer,
56
+ )
57
+ ```
58
+
59
+ ```ipython
60
+ >>> from pprint import pprint
61
+ >>> pprint(res)
62
+ [{'竞赛名称': [{'end': 13,
63
+ 'probability': 0.7825399252310206,
64
+ 'relations': {'主办方': [{'end': 22,
65
+ 'probability': 0.8421708822079559,
66
+ 'start': 14,
67
+ 'text': '中国中文信息学会'},
68
+ {'end': 30,
69
+ 'probability': 0.758080734850175,
70
+ 'start': 23,
71
+ 'text': '中国计算机学会'}],
72
+ '已举办次数': [{'end': 82,
73
+ 'probability': 0.46713059200541807,
74
+ 'start': 80,
75
+ 'text': '4届'}],
76
+ '承办方': [{'end': 55,
77
+ 'probability': 0.7000500325229737,
78
+ 'start': 40,
79
+ 'text': '中国中文信息学会评测工作委员会'},
80
+ {'end': 72,
81
+ 'probability': 0.6193481234526885,
82
+ 'start': 56,
83
+ 'text': '中国计算机学会自然语言处理专委会'},
84
+ {'end': 39,
85
+ 'probability': 0.8292709340121291,
86
+ 'start': 35,
87
+ 'text': '百度公司'}]},
88
+ 'start': 0,
89
+ 'text': '2022语言与智能技术竞赛'}]}]
90
+
91
+ ```
92
+
93
+ ### 事件抽取
94
+
95
+ ```python
96
+ from transformers import AutoModel, AutoTokenizer
97
+ model = AutoModel.from_pretrained('Casually/uie-base', trust_remote_code=True)
98
+ model.eval().to('cuda')
99
+ tokenizer = AutoTokenizer.from_pretrained('Casually/uie-base')
100
+ schema = {'地震触发词': ['地震强度', '时间', '震中位置', '震源深度']}
101
+ res = model.predict(schema=schema,
102
+ input_texts='中国地震台网正式测定:5月16日06时08分在云南临沧市凤庆县(北纬24.34度,东经99.98度)发生3.5级地震,震源深度10千米。',
103
+ tokenizer=tokenizer,
104
+ )
105
+ ```
106
+
107
+ ```ipython
108
+ >>> from pprint import pprint
109
+ >>> pprint(res)
110
+ [{'地震触发词': [{'end': 58,
111
+ 'probability': 0.9977425555988333,
112
+ 'relations': {'地震强度': [{'end': 56,
113
+ 'probability': 0.998080217831891,
114
+ 'start': 52,
115
+ 'text': '3.5级'}],
116
+ '时间': [{'end': 22,
117
+ 'probability': 0.9853299772936026,
118
+ 'start': 11,
119
+ 'text': '5月16日06时08分'}],
120
+ '震中位置': [{'end': 50,
121
+ 'probability': 0.7874016313748768,
122
+ 'start': 23,
123
+ 'text': '云南临沧市凤庆县(北纬24.34度,东经99.98度)'}],
124
+ '震源深度': [{'end': 67,
125
+ 'probability': 0.9937973233053299,
126
+ 'start': 63,
127
+ 'text': '10千米'}]},
128
+ 'start': 56,
129
+ 'text': '地震'}]}]
130
+
131
+ ```