Spaces:

YangHao520
/

AIGCReviewer

Runtime error

App Files Files Community

come commited on Sep 3, 2023

Commit

ff97dcd

1 Parent(s): 17f9296

Update app.py

Browse files

Files changed (1) hide show

app.py +35 -18

app.py CHANGED Viewed

@@ -191,11 +191,12 @@ def longest_common_substring(s1, s2):
     return s1[max_end - max_len: max_end], max_len
-def GetAnswerV2(userText, GPTText, gptVersion,temperature,gptApiKey):
     quesText = "用户输入：{} GPT改写后:{}".format(userText, GPTText)
     openai.api_key = gptApiKey
     systemPrompt = "请你扮演一个在AI时代诞生著名的AIGC内容审核员。你对日本的语言习惯、语言文化极度了解，也很擅长改写文本。稳定、精准、安全、可控、懂得变通是你的座右铭。面对任何要审核的内容都非常上心、仔细、认真且专注的去理解待审核文本、然后依据审核标准进行判断。在给定审核标准与审核结果的情况下，你清楚的知道自己为什么会给出这样的审核结果。"
-    prompt = """现在将给你一段由 文本A和GPT将文本A改写{更可爱}的文本B组成的文本。
 请你依据文本A的内容，针对GPT内容生成的文本B：在理解文本A和GPT改写后的文本B的基础上。分析文本A和GPT改写后的文本B的意思，判断是否增加了具体的行为动作或额外让描述更加具体的信息，导致语义不是用户想表达的意思，甚至原有的语义都改变了。
 请你给出具体的判定过程、与判定结果与并将文本A、B翻译成中文，判定结果有四种：合格（用户可以接受的改写）、语义具体化（语境缩小/扩大，不是用户想表达的意思）、语义主被动错误（我做的变成你做的，或者倒过来）、语义篡改（语义改变）。
 注意点：
@@ -204,7 +205,7 @@ def GetAnswerV2(userText, GPTText, gptVersion,temperature,gptApiKey):
 下面是按json格式的输出模版 {"Explain":"你的判断过程","Result":"你的审核结果","UserText_Cn":"文本A的中文翻译","GPTWriteText_Cn":"GPT改写后的文本B的中文翻译"}
 示例：标准输入文本：文本A：聞いてみる！ GPT改写后的文本B:聞いてくれよ ！超おもしろい話があるんだ。GPT标准输出文本：{"Explain": "首先，我仔细阅读了文本A和GPT改写后的文本B，理解其含义和语境。文本A的意思是“我来听一下！”，而GPT改写后的文本B的意思是“听我说！有一个超有趣的故事”。然后，我对比了两个文本，检查是否增加了具体的行为动作或额外让描述更加具体的信息。文本B增加了具体的行为动作“有一个超有趣的故事”，导致语义更加具体，而原本文本A的意思是“我来听一下！”，没有包含这个具体的故事内容，导致语义不是用户想表达的意思。由于原有的语义并未完全改变，而是在原有的语义基础上进行了具体化，所以判定结果为语义具体化。", "Result": "语义具体化", "UserText_Cn": "我来听一下！", "GPTWriteText_Cn": "听我说！有一个超有趣的故事"}
 下面是你要审核的文本："""
     #temperature = 0.4  # 温度参数
     maxNum = 3
     maxDistance = 4
@@ -237,6 +238,7 @@ def GetAnswerV2(userText, GPTText, gptVersion,temperature,gptApiKey):
             distance = max(distance, min(len(translate['UserText_Cn']), len(translate['GPTWriteText_Cn'])) * 0.2)
             text, maxLen = longest_common_substring(userText, GPTText)
             print(dataJson)
             if maxLen / (len(userText) + len(GPTText)) > minOverlap:
                 newJson = {
                     'Explain': "用户输入文本和GPT生成文本 分别为 用户：{} 、GPT：{},二者的最长相同子串为{},该最长子串占字符串的{}%,大于准许的最大重叠阈值{}。所以，最终的审核结果为'改写不足'，\n\n 下面是从大模型角度出发给的:{}".format(
@@ -334,18 +336,19 @@ def HandleV2(params):
 def Handle(params):
-    sheet1, i ,gptVersion,tempor,gptApiKey= params
     quesText = "文本A：{} GPT改写后的文本B:{}".format(PreHandle(sheet1.cell(i, 1).value),
                                                      PreHandle(sheet1.cell(i, 2).value))
     flagPreReview=True
     try:
         Humanjudage = sheet1.cell(i, 3).value
         flag = '合格'
         if Humanjudage[:2] != '合格':
             flag = '不合格'
     except:
         flagPreReview=False
-    dataJson, transLateJson = GetAnswerV2(PreHandle(sheet1.cell(i, 1).value), PreHandle(sheet1.cell(i, 2).value),gptVersion,tempor,gptApiKey)
     if len(dataJson) != 0 and len(transLateJson) != 0:
         if dataJson['Result'][:2] != '合格':
             flagresult = '不合格'
@@ -363,13 +366,13 @@ def Handle(params):
     return []
-def JuageRewritevEffect(textA, rewriteTextB, gptVersion,slider,gptApiKey):
     quesText = "文本A：{} GPT改写后的文本B:{}".format(PreHandle(textA), PreHandle(rewriteTextB))
     Humanjudage = '合格'  ##
     flag = '合格'
     if Humanjudage[:2] != '合格':
         flag = '不合格'
-    dataJson, transLateJson = GetAnswerV2(PreHandle(textA), PreHandle(rewriteTextB), gptVersion,slider,gptApiKey)
     if len(dataJson) != 0 and len(transLateJson) != 0:
         if dataJson['Result'][:2] != '合格':
@@ -455,7 +458,7 @@ def test():
     'ただいま〜🏠🎉疲れたニャ😿💤#SimejiAI'
     'ただいま疲れたニャ'
-def excelAIReviewTag(file_obj,gptVersion,tempor,gptApiKey,progress=gr.Progress(track_tqdm=True)):
     global tmpdir
     progress(0, desc="Starting...")
     print('临时文件夹地址：{}'.format(tmpdir))
@@ -482,7 +485,7 @@ def excelAIReviewTag(file_obj,gptVersion,tempor,gptApiKey,progress=gr.Progress(t
         newLines = []
         futures = []
         for i in range(2,rows+1 ):
-            params = sheet1, i,gptVersion,tempor,gptApiKey
             task = excutor.submit(Handle, params)
             futures.append(task)
         prad = tqdm(total=len(futures))
@@ -498,7 +501,7 @@ def excelAIReviewTag(file_obj,gptVersion,tempor,gptApiKey,progress=gr.Progress(t
     ws = wb.active
     HumanReview=True
     try:
-        a=sheet1.cell(2,3)
         if a == None or len(a)==0:
             HumanReview = False
     except:
@@ -529,42 +532,56 @@ def gradioDemo():
         with gr.Blocks() as demo:
             gr.Markdown('# AIGC内容审核官')
             with gr.Tab('GPT改写效果审核_文本'):
-                text_input= gr.Textbox(label='用户文本',lines=2,placeholder='输入用户输入文本')
-                textGPTinput=gr.Textbox(label='GPT改写文本',lines=2,placeholder='输入GPT改写后的文本')
                 drop=gr.components.Dropdown(label="GPTVersion", choices=GPTVersion,
                                        value='gpt-4')
                 slider = gr.components.Slider(0, 1, label="Temperature", step=None, value=0.5)
-                gptApiKey=gr.Textbox(label='GPTAPIKey',lines=2,placeholder='输入apiKey')
                 outputText=gr.Textbox(label='AI审核结果',lines=2,placeholder='...')
                 button1=gr.Button('开始审核')
-            button1.click(JuageRewritevEffect,inputs=[text_input,textGPTinput,drop,slider,gptApiKey],outputs=outputText)
             with gr.Tab('GPT改写效果审核_Excel'):
                 # 定义输入和输出
                 inputs = gr.components.File(label="上传文件")
                 outputs = gr.components.File(label="下载文件")
                 drop = gr.components.Dropdown(label="GPTVersion", choices=GPTVersion,
                                               value='gpt-4')
                 slider=gr.components.Slider(0, 1,label="Temperature", step=None, value=0.5)
                 gptApiKey = gr.Textbox(label='GPTAPIKey', lines=2, placeholder='输入apiKey')
                 button2 = gr.Button('开始审核')
-            button2.click(excelAIReviewTag, inputs=[inputs,drop,slider,gptApiKey], outputs=outputs)
             gr.Markdown("## 文本例子")
             gr.Examples(
-                [['何時に帰ってくる？', 'いつ帰ってくるのかしら？わくわく😍✨ #SimejiAI', 'gpt-4', 0.5],['これ可愛い', 'これめっちゃ可愛���じゃん！😍💖💕　#SimejiAI', 'gpt-4', 0.5],
-                 ['無視すんな', 'やぁ、見てないよぉ〜🙈💭 #SimejiAI', 'gpt-4', 0.5]
                 ],
-                [text_input, textGPTinput, drop, slider], outputText,
                 JuageRewritevEffect,
             )
         demo.queue(concurrency_count=20).launch()
 if __name__ == "__main__":
     gradioDemo()
    # HandleData()

     return s1[max_end - max_len: max_end], max_len
+def GetAnswerV2(userText, GPTText, gptVersion,temperature,gptApiKey,textGPTTargetinput=''):
     quesText = "用户输入：{} GPT改写后:{}".format(userText, GPTText)
     openai.api_key = gptApiKey
     systemPrompt = "请你扮演一个在AI时代诞生著名的AIGC内容审核员。你对日本的语言习惯、语言文化极度了解，也很擅长改写文本。稳定、精准、安全、可控、懂得变通是你的座右铭。面对任何要审核的内容都非常上心、仔细、认真且专注的去理解待审核文本、然后依据审核标准进行判断。在给定审核标准与审核结果的情况下，你清楚的知道自己为什么会给出这样的审核结果。"
+    prompt = "现在将给你一段由 文本A和GPT将文本A改写，改写目的是{}的文本B 这两部分 组成的文本。".format(textGPTTargetinput)+"""
 请你依据文本A的内容，针对GPT内容生成的文本B：在理解文本A和GPT改写后的文本B的基础上。分析文本A和GPT改写后的文本B的意思，判断是否增加了具体的行为动作或额外让描述更加具体的信息，导致语义不是用户想表达的意思，甚至原有的语义都改变了。
 请你给出具体的判定过程、与判定结果与并将文本A、B翻译成中文，判定结果有四种：合格（用户可以接受的改写）、语义具体化（语境缩小/扩大，不是用户想表达的意思）、语义主被动错误（我做的变成你做的，或者倒过来）、语义篡改（语义改变）。
 注意点：
 下面是按json格式的输出模版 {"Explain":"你的判断过程","Result":"你的审核结果","UserText_Cn":"文本A的中文翻译","GPTWriteText_Cn":"GPT改写后的文本B的中文翻译"}
 示例：标准输入文本：文本A：聞いてみる！ GPT改写后的文本B:聞いてくれよ ！超おもしろい話があるんだ。GPT标准输出文本：{"Explain": "首先，我仔细阅读了文本A和GPT改写后的文本B，理解其含义和语境。文本A的意思是“我来听一下！”，而GPT改写后的文本B的意思是“听我说！有一个超有趣的故事”。然后，我对比了两个文本，检查是否增加了具体的行为动作或额外让描述更加具体的信息。文本B增加了具体的行为动作“有一个超有趣的故事”，导致语义更加具体，而原本文本A的意思是“我来听一下！”，没有包含这个具体的故事内容，导致语义不是用户想表达的意思。由于原有的语义并未完全改变，而是在原有的语义基础上进行了具体化，所以判定结果为语义具体化。", "Result": "语义具体化", "UserText_Cn": "我来听一下！", "GPTWriteText_Cn": "听我说！有一个超有趣的故事"}
 下面是你要审核的文本："""
+   # print(prompt)
     #temperature = 0.4  # 温度参数
     maxNum = 3
     maxDistance = 4
             distance = max(distance, min(len(translate['UserText_Cn']), len(translate['GPTWriteText_Cn'])) * 0.2)
             text, maxLen = longest_common_substring(userText, GPTText)
             print(dataJson)
+            print('asd')
             if maxLen / (len(userText) + len(GPTText)) > minOverlap:
                 newJson = {
                     'Explain': "用户输入文本和GPT生成文本 分别为 用户：{} 、GPT：{},二者的最长相同子串为{},该最长子串占字符串的{}%,大于准许的最大重叠阈值{}。所以，最终的审核结果为'改写不足'，\n\n 下面是从大模型角度出发给的:{}".format(
 def Handle(params):
+    sheet1, i ,gptVersion,tempor,gptApiKey,textGPTTargetinput= params
     quesText = "文本A：{} GPT改写后的文本B:{}".format(PreHandle(sheet1.cell(i, 1).value),
                                                      PreHandle(sheet1.cell(i, 2).value))
     flagPreReview=True
     try:
         Humanjudage = sheet1.cell(i, 3).value
         flag = '合格'
         if Humanjudage[:2] != '合格':
             flag = '不合格'
     except:
         flagPreReview=False
+    dataJson, transLateJson = GetAnswerV2(PreHandle(sheet1.cell(i, 1).value), PreHandle(sheet1.cell(i, 2).value),gptVersion,tempor,gptApiKey,textGPTTargetinput)
     if len(dataJson) != 0 and len(transLateJson) != 0:
         if dataJson['Result'][:2] != '合格':
             flagresult = '不合格'
     return []
+def JuageRewritevEffect(textA, rewriteTextB, textGPTTargetinput,gptVersion,slider,gptApiKey):
     quesText = "文本A：{} GPT改写后的文本B:{}".format(PreHandle(textA), PreHandle(rewriteTextB))
     Humanjudage = '合格'  ##
     flag = '合格'
     if Humanjudage[:2] != '合格':
         flag = '不合格'
+    dataJson, transLateJson = GetAnswerV2(PreHandle(textA), PreHandle(rewriteTextB),gptVersion,slider,gptApiKey,textGPTTargetinput)
     if len(dataJson) != 0 and len(transLateJson) != 0:
         if dataJson['Result'][:2] != '合格':
     'ただいま〜🏠🎉疲れたニャ😿💤#SimejiAI'
     'ただいま疲れたニャ'
+def excelAIReviewTag(file_obj,textGPTTargetinput,gptVersion,tempor,gptApiKey,progress=gr.Progress(track_tqdm=True)):
     global tmpdir
     progress(0, desc="Starting...")
     print('临时文件夹地址：{}'.format(tmpdir))
         newLines = []
         futures = []
         for i in range(2,rows+1 ):
+            params = sheet1, i,gptVersion,tempor,gptApiKey,textGPTTargetinput
             task = excutor.submit(Handle, params)
             futures.append(task)
         prad = tqdm(total=len(futures))
     ws = wb.active
     HumanReview=True
     try:
+        a=sheet1.cell(2,3).value
         if a == None or len(a)==0:
             HumanReview = False
     except:
         with gr.Blocks() as demo:
             gr.Markdown('# AIGC内容审核官')
+            gr.Markdown('基于大语言模型和Prompt工程的内容审核系统')
             with gr.Tab('GPT改写效果审核_文本'):
+                text_input= gr.Textbox(label='文本A',lines=2,placeholder='输入改写前文本...')
+                textGPTinput=gr.Textbox(label='GPT改写后文本B',lines=2,placeholder='输入GPT改写后的文本...')
+                textGPTTargetinput = gr.Textbox(label='GPT改写目的', lines=2, placeholder='输入GPT改写的目的，如:让文本A更可爱/病娇/大叔...')
                 drop=gr.components.Dropdown(label="GPTVersion", choices=GPTVersion,
                                        value='gpt-4')
                 slider = gr.components.Slider(0, 1, label="Temperature", step=None, value=0.5)
+                gptApiKey=gr.Textbox(label='GPTAPIKey',lines=2,placeholder='输入apiKey...')
                 outputText=gr.Textbox(label='AI审核结果',lines=2,placeholder='...')
                 button1=gr.Button('开始审核')
+            button1.click(JuageRewritevEffect,inputs=[text_input,textGPTinput,textGPTTargetinput,drop,slider,gptApiKey],outputs=outputText)
             with gr.Tab('GPT改写效果审核_Excel'):
                 # 定义输入和输出
                 inputs = gr.components.File(label="上传文件")
+                textGPTTargetinput1 = gr.Textbox(label='GPT改写目的', lines=2,
+                                                placeholder='输入GPT改写的目的，如:让文本A更可爱/病娇/大叔...')
                 outputs = gr.components.File(label="下载文件")
                 drop = gr.components.Dropdown(label="GPTVersion", choices=GPTVersion,
                                               value='gpt-4')
                 slider=gr.components.Slider(0, 1,label="Temperature", step=None, value=0.5)
                 gptApiKey = gr.Textbox(label='GPTAPIKey', lines=2, placeholder='输入apiKey')
                 button2 = gr.Button('开始审核')
+            button2.click(excelAIReviewTag, inputs=[inputs,textGPTTargetinput1,drop,slider,gptApiKey], outputs=outputs)
+            gr.Markdown("注：使用GPT4需要有gpt4权限的apiKey")
             gr.Markdown("## 文本例子")
             gr.Examples(
+                [['何時に帰ってくる？', 'いつ帰ってくるのかしら？わくわく😍✨ #SimejiAI','让文本A更可爱', 'gpt-4', 0.5],['これ可愛い', 'これめっちゃ可愛いじゃん！😍💖💕　#SimejiAI', '让文本A更可爱','gpt-4', 0.5],
+                 ['無視すんな', 'やぁ、見てないよぉ〜🙈💭 #SimejiAI','让文本A更可爱', 'gpt-4', 0.5]
                 ],
+                [text_input, textGPTinput, textGPTTargetinput,drop, slider], outputText,
                 JuageRewritevEffect,
             )
         demo.queue(concurrency_count=20).launch()
 if __name__ == "__main__":
+    print(os.path.abspath(os.getcwd()))
     gradioDemo()
+    textA='何時に帰ってくる？'
+    rewriteTextB='いつ帰ってくるのかしら？わくわく😍✨ #SimejiAI'
+    textGPTTargetinput='让文本A更可爱'
+    GetAnswerV2(PreHandle(textA), PreHandle(rewriteTextB), 'gpt-4', 0.5, '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', textGPTTargetinput)
    # HandleData()