jutor_write

Running

App Files Files Community

youngtsai commited on Aug 24, 2024

Commit

2f81547

1 Parent(s): 40da85f

def generate_content_by_open_ai_assistant_spelling_robot(paragraph, thread_id=None, model_name=None):

Browse files

Files changed (1) hide show

app.py +113 -18

app.py CHANGED Viewed

@@ -33,6 +33,7 @@ if is_env_local:
         GCS_KEY = json.dumps(config["GOOGLE_APPLICATION_CREDENTIALS_JSON"])
         CUTOR_OPEN_AI_KEY = config["CUTOR_OPEN_AI_KEY"]
         CUTOR_OPEN_AI_ASSISTANT_ID = config["CUTOR_OPEN_AI_ASSISTANT_ID"]
         OPEN_AI_MODERATION_BOT1 = config["OPEN_AI_MODERATION_BOT1"]
 else:
@@ -40,6 +41,7 @@ else:
     GCS_KEY = os.getenv("GOOGLE_APPLICATION_CREDENTIALS_JSON")
     CUTOR_OPEN_AI_KEY = os.getenv("CUTOR_OPEN_AI_KEY")
     CUTOR_OPEN_AI_ASSISTANT_ID = os.getenv("CUTOR_OPEN_AI_ASSISTANT_ID")
     OPEN_AI_MODERATION_BOT1 = os.getenv("OPEN_AI_MODERATION_BOT1", OPEN_AI_KEY)
 OPEN_AI_CLIENT = OpenAI(api_key=OPEN_AI_KEY)
@@ -1165,7 +1167,7 @@ def get_chinese_conversation_thread_id(thread_id):
         thread_id = thread.id
         return thread_id
-def get_chinese_paragraph_evaluate_content(thread_id, model, user_content):
     content = generate_content_by_open_ai_assistant(user_content, thread_id, model_name=model)
     print(f"====generate_paragraph_evaluate====")
     print(content)
@@ -1176,7 +1178,7 @@ def get_chinese_paragraph_evaluate_content(thread_id, model, user_content):
     content_list = content.split("```json")
     content_text = content_list[0]
     print(f"content_text: {content_text}")
-    content_json = content_list[1].replace("```", "")
     print(f"content_json: {content_json}")
     data = json.loads(content_json)["results"]
@@ -1185,11 +1187,34 @@ def get_chinese_paragraph_evaluate_content(thread_id, model, user_content):
         ["主題與內容", data['主題與內容']['level'], data['主題與內容']['explanation']],
         ["段落結構", data['段落結構']['level'], data['段落結構']['explanation']],
         ["遣詞造句", data['遣詞造句']['level'], data['遣詞造句']['explanation']],
-        ["錯別字", data['錯別字']['level'], data['錯別字']['explanation']]
     ]
     # 綜合評分
-    grade = assign_grade(data['主題與內容']['level'], data['段落結構']['level'], data['遣詞造句']['level'], data['錯別字']['level'])
     grade_content_text = f"# 綜合評分：{grade}"
     total_content_text = grade_content_text + "\n" + content_text
@@ -1214,7 +1239,7 @@ def get_chinese_paragraph_1st_evaluate_content(thread_id, model, sys_content, pa
         ---
         {user_generate_paragraph_evaluate_prompt}
     """
-    total_content_text, content_table = get_chinese_paragraph_evaluate_content(thread_id, model, user_content)
     return total_content_text, content_table
@@ -1229,7 +1254,7 @@ def get_chinese_paragraph_refine_evaluate_content(thread_id, model, sys_content,
         ---
         {user_refine_paragraph_prompt}
     """
-    total_content_text, content_table = get_chinese_paragraph_evaluate_content(thread_id, model, user_content)
     return total_content_text, content_table
@@ -1280,6 +1305,88 @@ def generate_content_by_open_ai_assistant(user_content, thread_id=None, model_na
     return response_text
 # 小工具
 def show_elements():
     return gr.update(visible=True)
@@ -3108,8 +3215,6 @@ with gr.Blocks(theme=THEME, css=CSS) as demo:
                         遣詞造句：A 你的遣詞造句大致良好，用詞得體且通順。不過可以嘗試加一些更具體的技術詞彙或示例，使文章更專業化。
-                        錯別字：A+ 你的文章沒有明顯的錯別字，這點做得很好 (或是你有以下的錯別字: ...... )。
                         # 修改範例
                         - 原文：內容雖然簡短，但主題明確。
                           - 修改：雖然內容相對簡短，但主題表達得非常明確。
@@ -3132,10 +3237,6 @@ with gr.Blocks(theme=THEME, css=CSS) as demo:
                                 "遣詞造句": {{
                                     "level": "C",
                                     "explanation": "#中文解釋 ZH-TW"
-                                }},
-                                "錯別字": {{
-                                    "level": "C-",
-                                    "explanation": "#中文解釋 ZH-TW"
                                 }}
                             }}
                         }}
@@ -3195,8 +3296,6 @@ with gr.Blocks(theme=THEME, css=CSS) as demo:
                         遣詞造句：A 你的遣詞造句大致良好，用詞得體且通順。不過可以嘗試加一些更具體的技術詞彙或示例，使文章更專業化。
-                        錯別字：A+ 你的文章沒有明顯的錯別字，這點做得很好。（或是你有以下的錯別字: ......）。
                         # 修改範例
                         - 原文：內容雖然簡短，但主題明確。
                           - 修改：雖然內容相對簡短，但主題表達得非常明確。
@@ -3219,10 +3318,6 @@ with gr.Blocks(theme=THEME, css=CSS) as demo:
                                 "遣詞造句": {{
                                     "level": "C",
                                     "explanation": "#中文解釋 ZH-TW"
-                                }},
-                                "錯別字": {{
-                                    "level": "C-",
-                                    "explanation": "#中文解釋 ZH-TW"
                                 }}
                             }}
                         }}

         GCS_KEY = json.dumps(config["GOOGLE_APPLICATION_CREDENTIALS_JSON"])
         CUTOR_OPEN_AI_KEY = config["CUTOR_OPEN_AI_KEY"]
         CUTOR_OPEN_AI_ASSISTANT_ID = config["CUTOR_OPEN_AI_ASSISTANT_ID"]
+        CUTOR_OPEN_AI_ASSISTANT_SPELLING_ID = config["CUTOR_OPEN_AI_ASSISTANT_SPELLING_ID"]
         OPEN_AI_MODERATION_BOT1 = config["OPEN_AI_MODERATION_BOT1"]
 else:
     GCS_KEY = os.getenv("GOOGLE_APPLICATION_CREDENTIALS_JSON")
     CUTOR_OPEN_AI_KEY = os.getenv("CUTOR_OPEN_AI_KEY")
     CUTOR_OPEN_AI_ASSISTANT_ID = os.getenv("CUTOR_OPEN_AI_ASSISTANT_ID")
+    CUTOR_OPEN_AI_ASSISTANT_SPELLING_ID = os.getenv("CUTOR_OPEN_AI_ASSISTANT_SPELLING_ID")
     OPEN_AI_MODERATION_BOT1 = os.getenv("OPEN_AI_MODERATION_BOT1", OPEN_AI_KEY)
 OPEN_AI_CLIENT = OpenAI(api_key=OPEN_AI_KEY)
         thread_id = thread.id
         return thread_id
+def get_chinese_paragraph_evaluate_content(thread_id, model, user_content, paragraph):
     content = generate_content_by_open_ai_assistant(user_content, thread_id, model_name=model)
     print(f"====generate_paragraph_evaluate====")
     print(content)
     content_list = content.split("```json")
     content_text = content_list[0]
     print(f"content_text: {content_text}")
+    content_json = content_list[1].split("```")[0]
     print(f"content_json: {content_json}")
     data = json.loads(content_json)["results"]
         ["主題與內容", data['主題與內容']['level'], data['主題與內容']['explanation']],
         ["段落結構", data['段落結構']['level'], data['段落結構']['explanation']],
         ["遣詞造句", data['遣詞造句']['level'], data['遣詞造句']['explanation']],
     ]
+    # 挑錯字
+    spelling_content = generate_content_by_open_ai_assistant_spelling_robot(paragraph, thread_id=None, model_name=model)
+    print(f"spelling_content: {spelling_content}")
+    if "```json" not in spelling_content:
+        raise gr.Error("網路塞車，或是內容有誤，請稍後重新嘗試！")
+    spelling_content_list = spelling_content.split("```json")
+    spelling_content_text = spelling_content_list[0]
+    spelling_content_json = spelling_content_list[1].split("```")[0]
+    spelling_content_table = json.loads(spelling_content_json)["results"]["錯別字"]
+    spelling_table_data = [
+        ["錯別字", spelling_content_table['level'], spelling_content_table['explanation']],
+    ]
+    # ========= 合併 =========
+    table_data.extend(spelling_table_data)
+    content_text = content_text + "\n" + spelling_content_text
     # 綜合評分
+    grade = assign_grade(
+        data['主題與內容']['level'],
+        data['段落結構']['level'],
+        data['遣詞造句']['level'],
+        spelling_content_table['level']
+    )
     grade_content_text = f"# 綜合評分：{grade}"
     total_content_text = grade_content_text + "\n" + content_text
         ---
         {user_generate_paragraph_evaluate_prompt}
     """
+    total_content_text, content_table = get_chinese_paragraph_evaluate_content(thread_id, model, user_content, paragraph)
     return total_content_text, content_table
         ---
         {user_refine_paragraph_prompt}
     """
+    total_content_text, content_table = get_chinese_paragraph_evaluate_content(thread_id, model, user_content, paragraph_2)
     return total_content_text, content_table
     return response_text
+# 錯別字機器人
+def generate_content_by_open_ai_assistant_spelling_robot(paragraph, thread_id=None, model_name=None):
+    verify_moderation(paragraph)
+    client = CUTOR_OPEN_AI_CLIENT
+    assistant_id = CUTOR_OPEN_AI_ASSISTANT_SPELLING_ID
+    assistant = client.beta.assistants.update(
+        assistant_id=assistant_id,
+        tools=[{"type": "file_search"}],
+    )
+    print(f"My assistant: {assistant}")
+    print(f"instructions: {assistant.instructions}")
+    try:
+        thread_id = get_chinese_conversation_thread_id(thread_id) if not thread_id else thread_id
+        thread = client.beta.threads.retrieve(thread_id)
+        print(f"Thread ID: {thread.id}")
+        # Send the user message to the thread
+        print("==============Send the user message to the thread====================")
+        user_content = f"""
+            this is the paragraph: {paragraph}
+            ---
+            Rule:
+            1. 請根據 instructions 來挑出錯別字，並輸出錯別字的等級與解釋
+            2. 請輸出錯別字的等級與解釋，並輸出錯別字的等級與解釋 by json format as example
+            3. 請用 zh-TW 繁體中文輸出
+            4. json 完成之後不用多作解釋
+            EXAMPLE:
+                # 錯別字檢查：
+                1. 「產線」應作「產線」。
+                    - 原文：「擔任產線主任的老闆弟弟...」
+                    - 修正：「擔任產線主任的老闆弟弟...」
+                2. 「保母」應作「保姆」。
+                    - 原文：「平時不只得充當保母...」
+                    - 修正：「平時不只得充當保姆...」
+                # 數字書寫檢查：
+                1. 「1名」應作「一名」。
+                    - 原文：「1名女網友在傳產公司...」
+                    - 修正：「一名女網友在傳產公司...」
+                2. 「3個多月」應作「三個多月」。
+                    - 原文：「工作至今約3個多月...」
+                    - 修正：「工作至今約三個多月...」
+                ```json
+                {{
+                    "results": {{
+                        "錯別字": {{
+                            "level": "A+",
+                            "explanation": "#中文解釋 ZH-TW"
+                        }}
+                    }}
+                }}
+                ```
+        """
+        client.beta.threads.messages.create(thread_id=thread.id, role="user", content=user_content)
+        # Run the assistant
+        print("==============Run the assistant====================")
+        run = client.beta.threads.runs.create_and_poll(
+            thread_id=thread.id,
+            assistant_id=assistant.id,
+            tools=[{"type": "file_search"}],
+        )
+        if run.status == "completed":
+            print("==============completed====================")
+            print(f"Thread ID: {thread.id}")
+            messages = client.beta.threads.messages.list(thread_id=thread.id)
+            print(f"Messages: {messages}")
+            response = messages
+            response_text = messages.data[0].content[0].text.value
+            print(f"Response: {response_text}")
+    except Exception as e:
+        print(f"An error occurred while generating content by OpenAI Assistant: {e}")
+        raise gr.Error("網路塞車，請重新嘗試一次！")
+    return response_text
 # 小工具
 def show_elements():
     return gr.update(visible=True)
                         遣詞造句：A 你的遣詞造句大致良好，用詞得體且通順。不過可以嘗試加一些更具體的技術詞彙或示例，使文章更專業化。
                         # 修改範例
                         - 原文：內容雖然簡短，但主題明確。
                           - 修改：雖然內容相對簡短，但主題表達得非常明確。
                                 "遣詞造句": {{
                                     "level": "C",
                                     "explanation": "#中文解釋 ZH-TW"
                                 }}
                             }}
                         }}
                         遣詞造句：A 你的遣詞造句大致良好，用詞得體且通順。不過可以嘗試加一些更具體的技術詞彙或示例，使文章更專業化。
                         # 修改範例
                         - 原文：內容雖然簡短，但主題明確。
                           - 修改：雖然內容相對簡短，但主題表達得非常明確。
                                 "遣詞造句": {{
                                     "level": "C",
                                     "explanation": "#中文解釋 ZH-TW"
                                 }}
                             }}
                         }}