kai-law2

Runtime error

App Files Files Community

seawolf2357 commited on Jun 19, 2024

Commit

a8450bf

verified ·

1 Parent(s): be78b1e

Update app.py

Browse files

Files changed (1) hide show

app.py +10 -17

app.py CHANGED Viewed

@@ -30,13 +30,9 @@ def load_optimized_dataset(data_files):
     data_frames = [pd.read_csv(file) for file in data_files]
     full_data = pd.concat(data_frames, ignore_index=True)
-    # 확인을 위한 데이터 샘플 출력
-    print(full_data[['사건명', '사건번호', '판시사항']].head())  # '판시사항' 필드의 데이터 샘플 출력
-    logging.debug(f"Columns in dataset: {full_data.columns}")
-    logging.debug(f"Sample data from '판시사항': {full_data['판시사항'].dropna().head()}")
     # NaN 값 처리
     full_data['판시사항'] = full_data['판시사항'].fillna('')
     # 사건명을 키로 하고 사건번호와 전문을 저장하는 딕셔너리 생성
     name_to_number = full_data.groupby('사건명')['사건번호'].apply(list).to_dict()
@@ -116,27 +112,24 @@ async def generate_response(message):
     user_input = message.content.strip()
     user_mention = message.author.mention
-    # 유사한 사건명 및 판시사항 찾기
     matched_case_names = process.extractBests(user_input, all_case_names, limit=3, score_cutoff=70)
     matched_case_summaries = process.extractBests(user_input, all_case_summaries, limit=3, score_cutoff=70)
     logging.debug(f"Matched case names: {matched_case_names}")
     logging.debug(f"Matched case summaries: {matched_case_summaries}")
     if matched_case_names:
-        case_numbers = []
         for case_name, score in matched_case_names:
-            case_numbers.extend(name_to_number.get(case_name, []))
-        case_numbers = list(set(case_numbers))
-        case_numbers_str = "\n".join(case_numbers)
-        system_message = f"{user_mention}, '{user_input}'와 유사한 사건명의 사건번호는 다음과 같습니다:\n{case_numbers_str}"
-    elif matched_case_summaries:
-        case_numbers = []
         for case_summary, score in matched_case_summaries:
-            case_numbers.extend(summary_to_number.get(case_summary, []))
-        case_numbers = list(set(case_numbers))
-        case_numbers_str = "\n".join(case_numbers)
-        system_message = f"{user_mention}, '{user_input}'와 유사한 판시사항의 사건번호는 다음과 같습니다:\n{case_numbers_str}"
     elif user_input in number_to_fulltext:
         full_text = number_to_fulltext[user_input]
         system_message = f"{user_mention}, 사건번호 '{user_input}'의 전문은 다음과 같습니다:\n\n{full_text}"

     data_frames = [pd.read_csv(file) for file in data_files]
     full_data = pd.concat(data_frames, ignore_index=True)
     # NaN 값 처리
     full_data['판시사항'] = full_data['판시사항'].fillna('')
+    full_data['사건명'] = full_data['사건명'].fillna('')
     # 사건명을 키로 하고 사건번호와 전문을 저장하는 딕셔너리 생성
     name_to_number = full_data.groupby('사건명')['사건번호'].apply(list).to_dict()
     user_input = message.content.strip()
     user_mention = message.author.mention
+    # 유사한 사건명 및 판시사항 각각 찾기
     matched_case_names = process.extractBests(user_input, all_case_names, limit=3, score_cutoff=70)
     matched_case_summaries = process.extractBests(user_input, all_case_summaries, limit=3, score_cutoff=70)
     logging.debug(f"Matched case names: {matched_case_names}")
     logging.debug(f"Matched case summaries: {matched_case_summaries}")
+    case_numbers_set = set()
     if matched_case_names:
         for case_name, score in matched_case_names:
+            case_numbers_set.update(name_to_number.get(case_name, []))
+    if matched_case_summaries:
         for case_summary, score in matched_case_summaries:
+            case_numbers_set.update(summary_to_number.get(case_summary, []))
+    if case_numbers_set:
+        case_numbers_str = "\n".join(case_numbers_set)
+        system_message = f"{user_mention}, '{user_input}'와 유사한 사건의 사건번호는 다음과 같습니다:\n{case_numbers_str}"
     elif user_input in number_to_fulltext:
         full_text = number_to_fulltext[user_input]
         system_message = f"{user_mention}, 사건번호 '{user_input}'의 전문은 다음과 같습니다:\n\n{full_text}"