kai-law

Runtime error

App Files Files Community

seawolf2357 commited on Jun 19, 2024

Commit

1a116fa

verified ·

1 Parent(s): 97ea916

Update app.py

Browse files

Files changed (1) hide show

app.py +44 -23

app.py CHANGED Viewed

@@ -8,6 +8,7 @@ from datasets import load_dataset
 import pandas as pd
 from fuzzywuzzy import process
 # 현재 작업 디렉토리 출력
 print("Current Working Directory:", os.getcwd())
@@ -28,16 +29,28 @@ else:
 def load_optimized_dataset(data_files):
     data_frames = [pd.read_csv(file) for file in data_files]
     full_data = pd.concat(data_frames, ignore_index=True)
     # 사건명을 키로 하고 사건번호와 전문을 저장하는 딕셔너리 생성
     name_to_number = full_data.groupby('사건명')['사건번호'].apply(list).to_dict()
     number_to_fulltext = full_data.set_index('사건번호')['전문'].to_dict()
-    return name_to_number, number_to_fulltext
-name_to_number, number_to_fulltext = load_optimized_dataset(data_files)
 print("Dataset loaded successfully.")
-# 사건명 리스트 생성
 all_case_names = list(name_to_number.keys())
 # 로깅 설정
 logging.basicConfig(level=logging.DEBUG, format='%(asctime)s:%(levelname)s:%(name)s: %(message)s', handlers=[logging.StreamHandler()])
@@ -79,9 +92,10 @@ class MyClient(discord.Client):
         self.is_processing = True
         try:
-            response = await generate_response(message)
-            if response and response.strip():
-                await message.channel.send(response)
             else:
                 await message.channel.send("죄송합니다, 제공할 수 있는 정보가 없습니다.")
         finally:
@@ -98,16 +112,24 @@ async def generate_response(message):
     user_input = message.content.strip()
     user_mention = message.author.mention
-    # 유사한 사건명 찾기
-    matched_case_names = process.extractBests(user_input, all_case_names, limit=3, score_cutoff=80)
     if matched_case_names:
-        case_numbers = []
         for case_name, score in matched_case_names:
-            case_numbers.extend(name_to_number[case_name])
-        case_numbers = list(set(case_numbers))  # 중복 제거
-        case_numbers_str = "\n".join(case_numbers)
-        system_message = f"{user_mention}, '{user_input}'와 유사한 사건명의 사건번호는 다음과 같습니다:\n{case_numbers_str}"
     elif user_input in number_to_fulltext:
         full_text = number_to_fulltext[user_input]
         system_message = f"{user_mention}, 사건번호 '{user_input}'의 전문은 다음과 같습니다:\n\n{full_text}"
@@ -116,15 +138,14 @@ async def generate_response(message):
     # 메시지 길이 제한 처리
     max_length = 2000
-    if len(system_message) > max_length:
-        response_parts = []
-        for i in range(0, len(system_message), max_length):
-            part_response = system_message[i:i + max_length]
-            await message.channel.send(part_response)
-            response_parts.append(part_response)
-        return response_parts[0] if response_parts else "죄송합니다, 제공할 수 있는 정보가 없습니다."
-    return system_message
 if __name__ == "__main__":
     discord_client = MyClient(intents=intents)
-    discord_client.run(os.getenv('DISCORD_TOKEN'))

 import pandas as pd
 from fuzzywuzzy import process
 # 현재 작업 디렉토리 출력
 print("Current Working Directory:", os.getcwd())
 def load_optimized_dataset(data_files):
     data_frames = [pd.read_csv(file) for file in data_files]
     full_data = pd.concat(data_frames, ignore_index=True)
+    # NaN 값 처리
+    full_data['판시사항'] = full_data['판시사항'].fillna('')
+    full_data['사건명'] = full_data['사건명'].fillna('')
     # 사건명을 키로 하고 사건번호와 전문을 저장하는 딕셔너리 생성
     name_to_number = full_data.groupby('사건명')['사건번호'].apply(list).to_dict()
+    summary_to_number = full_data.groupby('판시사항')['사건번호'].apply(list).to_dict()
     number_to_fulltext = full_data.set_index('사건번호')['전문'].to_dict()
+    return name_to_number, summary_to_number, number_to_fulltext
+name_to_number, summary_to_number, number_to_fulltext = load_optimized_dataset(data_files)
 print("Dataset loaded successfully.")
+# 사건명 및 판시사항 리스트 생성
 all_case_names = list(name_to_number.keys())
+all_case_summaries = list(summary_to_number.keys())
+# 디버깅용 로깅
+logging.debug(f"Sample all_case_names: {all_case_names[:3]}")
+logging.debug(f"Sample all_case_summaries: {all_case_summaries[:3]}")
 # 로깅 설정
 logging.basicConfig(level=logging.DEBUG, format='%(asctime)s:%(levelname)s:%(name)s: %(message)s', handlers=[logging.StreamHandler()])
         self.is_processing = True
         try:
+            response_parts = await generate_response(message)
+            if response_parts:
+                for part in response_parts:
+                    await message.channel.send(part)
             else:
                 await message.channel.send("죄송합니다, 제공할 수 있는 정보가 없습니다.")
         finally:
     user_input = message.content.strip()
     user_mention = message.author.mention
+    # 유사한 사건명 및 판시사항 각각 찾기
+    matched_case_names = process.extractBests(user_input, all_case_names, limit=3, score_cutoff=70)
+    matched_case_summaries = process.extractBests(user_input, all_case_summaries, limit=3, score_cutoff=70)
+    logging.debug(f"Matched case names: {matched_case_names}")
+    logging.debug(f"Matched case summaries: {matched_case_summaries}")
+    case_numbers_set = set()
     if matched_case_names:
         for case_name, score in matched_case_names:
+            case_numbers_set.update(name_to_number.get(case_name, []))
+    if matched_case_summaries:
+        for case_summary, score in matched_case_summaries:
+            case_numbers_set.update(summary_to_number.get(case_summary, []))
+    if case_numbers_set:
+        case_numbers_str = "\n".join(case_numbers_set)
+        system_message = f"{user_mention}, '{user_input}'와 유사한 사건의 사건번호는 다음과 같습니다:\n{case_numbers_str}"
     elif user_input in number_to_fulltext:
         full_text = number_to_fulltext[user_input]
         system_message = f"{user_mention}, 사건번호 '{user_input}'의 전문은 다음과 같습니다:\n\n{full_text}"
     # 메시지 길이 제한 처리
     max_length = 2000
+    response_parts = []
+    for i in range(0, len(system_message), max_length):
+        part_response = system_message[i:i + max_length]
+        response_parts.append(part_response)
+    return response_parts
 if __name__ == "__main__":
     discord_client = MyClient(intents=intents)
+    discord_client.run(os.getenv('DISCORD_TOKEN'))