File size: 1,433 Bytes
ec97ce5
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
# -*- coding:utf-8 -*-
# @FileName  :test.py.py
# @Time      :2023/4/19 13:39
# @Author    :lovemefan
# @Email     :[email protected]

import logging

from cttPunctuator import CttPunctuator

logging.basicConfig(
    level=logging.INFO,
    format="[%(asctime)s %(levelname)s] [%(filename)s:%(lineno)d %(module)s.%(funcName)s] %(message)s",
)
# offline mode
punc = CttPunctuator()
text = "据报道纽约时报使用ChatGPT创建了一个情人节消息生成器用户只需输入几个提示就可以得到一封自动生成的情书"
logging.info(punc.punctuate(text)[0])

# online mode
punc = CttPunctuator(online=True)
text_in = (
    "跨境河流是养育沿岸|人民的生命之源长期以来为帮助下游地区防灾减灾中方技术人员|"
    "在上游地区极为恶劣的自然条件下克服巨大困难甚至冒着生命危险|"
    "向印方提供汛期水文资料处理紧急事件中方重视印方在跨境河流>问题上的关切|"
    "愿意进一步完善双方联合工作机制|凡是|中方能做的我们|"
    "都会去做而且会做得更好我请印度朋友们放心中国在上游的|"
    "任何开发利用都会经过科学|规划和论证兼顾上下游的利益"
)

vads = text_in.split("|")
rec_result_all = ""
for vad in vads:
    result = punc.punctuate(vad)
    rec_result_all += result[0]
    logging.info(f"Part: {rec_result_all}")

logging.info(f"Final: {rec_result_all}")