Spaces:

Satoc
/

ClinicalTrialV2

Running

App Files Files Community

高橋慧 commited on 10 days ago

Commit

c308431

1 Parent(s): 5e2744f

stage3a

Browse files

Files changed (3) hide show

app.py +141 -26
requirements.txt +1 -26
requirements_stage3b.txt +28 -0

app.py CHANGED Viewed

@@ -3,19 +3,29 @@ import pandas as pd
 import time
 import traceback
 import os
-# 完全版のimportエラー対策
 try:
-    from OpenAITools.FetchTools import fetch_clinical_trials
-    from langchain_openai import ChatOpenAI
     from langchain_groq import ChatGroq
     from OpenAITools.CrinicalTrialTools import SimpleClinicalTrialAgent, GraderAgent, LLMTranslator, generate_ex_question_English
-    FULL_VERSION = True
-    print("✅ 完全版モジュールが正常にロードされました")
 except ImportError as e:
     print(f"⚠️ 完全版モジュールのインポートに失敗: {e}")
     print("軽量版モードで動作します")
-    FULL_VERSION = False
 # 環境変数チェック
 def check_environment():
@@ -57,6 +67,61 @@ def safe_init_agents():
 # エージェント初期化
 translator, CriteriaCheckAgent, grader_agent = safe_init_agents()
 # エラーハンドリング付きでエージェント評価を実行する関数
 def evaluate_with_retry(agent, criteria, question, max_retries=3):
     """エラーハンドリング付きでエージェント評価を実行"""
@@ -156,11 +221,44 @@ def generate_sample_dataframe(age, sex, tumor_type, GeneMutation, Meseable, Biop
         print(f"サンプルデータ生成エラー: {e}")
         return pd.DataFrame()
 # 完全版データ生成関数
 def generate_full_dataframe(age, sex, tumor_type, GeneMutation, Meseable, Biopsiable):
-    """完全版のデータ生成（実際のAPI使用）"""
     try:
-        # 入力検証
         if not all([age, sex, tumor_type]):
             return pd.DataFrame()
@@ -228,7 +326,7 @@ def generate_full_dataframe(age, sex, tumor_type, GeneMutation, Meseable, Biopsi
         available_columns = [col for col in columns_order if col in df.columns]
         df = df[available_columns]
-        print(f"評価完了。結果: {len(df)} 件")
         return df
     except Exception as e:
@@ -259,25 +357,35 @@ def download_full_csv(df):
         print(f"CSV保存エラー: {e}")
         return None
 # Gradioインターフェースの作成
 with gr.Blocks(title="臨床試験適格性評価", theme=gr.themes.Soft()) as demo:
     gr.Markdown("## 🏥 臨床試験適格性評価インターフェース")
-    # バージョン情報と状態表示
-    if FULL_VERSION and env_ok:
-        gr.Markdown("✅ **モード**: 完全版（API連携有効）")
-    elif FULL_VERSION and not env_ok:
-        gr.Markdown("⚠️ **モード**: 完全版（API制限あり）")
-    else:
-        gr.Markdown("🔧 **モード**: 軽量版（サンプルデータ）")
-    # 環境変数状態の表示
-    if env_ok:
-        gr.Markdown("✅ **API Status**: 全ての環境変数が設定されています")
     else:
-        gr.Markdown("⚠️ **API Status**: 環境変数が不足しています。Settings → Variables and secrets で設定してください")
-    gr.Markdown("💡 **使用方法**: 患者情報を入力してボタンをクリックしてください。完全版では実際のClinicalTrials.govからリアルタイムでデータを取得し、AIが適格性を評価します。")
     # 各種入力フィールド
     with gr.Row():
@@ -304,8 +412,10 @@ with gr.Blocks(title="臨床試験適格性評価", theme=gr.themes.Soft()) as d
     # ボタン類
     with gr.Row():
-        if FULL_VERSION and env_ok:
-            generate_button = gr.Button("🔍 Generate Clinical Trials Data (Real API)", variant="primary")
         else:
             generate_button = gr.Button("📋 Generate Sample Data", variant="primary")
@@ -330,9 +440,12 @@ with gr.Blocks(title="臨床試験適格性評価", theme=gr.themes.Soft()) as d
     def update_dataframe_and_state(age, sex, tumor_type, gene_mutation, measurable, biopsiable):
         """データフレーム生成と状態更新"""
         try:
-            if FULL_VERSION and env_ok:
-                progress_text.value = "🔍 実際の臨床試験データを検索中..."
                 df = generate_full_dataframe(age, sex, tumor_type, gene_mutation, measurable, biopsiable)
             else:
                 progress_text.value = "📋 サンプルデータを生成中..."
                 df = generate_sample_dataframe(age, sex, tumor_type, gene_mutation, measurable, biopsiable)
@@ -408,7 +521,9 @@ with gr.Blocks(title="臨床試験適格性評価", theme=gr.themes.Soft()) as d
     # フッター情報
     gr.Markdown("---")
-    gr.Markdown("🔬 **技術情報**: このシステムはClinicalTrials.gov API、LangChain、およびGroq/OpenAI APIを使用しています。")
 if __name__ == "__main__":
     demo.launch(

 import time
 import traceback
 import os
+import requests
+# 完全版のimportエラー対策（段階的フォールバック）
+LANGCHAIN_AVAILABLE = False
+FULL_VERSION = False
 try:
     from langchain_groq import ChatGroq
+    from langchain_openai import ChatOpenAI
+    LANGCHAIN_AVAILABLE = True
+    print("✅ LangChain基本ライブラリが利用可能です")
+except ImportError as e:
+    print(f"⚠️ LangChain基本ライブラリが利用できません: {e}")
+try:
+    from OpenAITools.FetchTools import fetch_clinical_trials
     from OpenAITools.CrinicalTrialTools import SimpleClinicalTrialAgent, GraderAgent, LLMTranslator, generate_ex_question_English
+    if LANGCHAIN_AVAILABLE:
+        FULL_VERSION = True
+        print("✅ 完全版モジュールが正常にロードされました")
 except ImportError as e:
     print(f"⚠️ 完全版モジュールのインポートに失敗: {e}")
     print("軽量版モードで動作します")
 # 環境変数チェック
 def check_environment():
 # エージェント初期化
 translator, CriteriaCheckAgent, grader_agent = safe_init_agents()
+# 基本的なClinicalTrials.gov API呼び出し（軽量版）
+def fetch_clinical_trials_basic(cancer_name):
+    """基本的な臨床試験データ取得（requestsのみ使用）"""
+    try:
+        search_expr = f"{cancer_name} SEARCH[Location](AREA[LocationCountry]Japan AND AREA[LocationStatus]Recruiting)"
+        base_url = "https://clinicaltrials.gov/api/v2/studies"
+        params = {
+            "query.titles": search_expr,
+            "pageSize": 20  # 軽量版では20件に制限
+        }
+        print(f"基本API呼び出し: {cancer_name}")
+        response = requests.get(base_url, params=params)
+        if response.status_code == 200:
+            data = response.json()
+            studies = data.get('studies', [])
+            data_list = []
+            for study in studies:
+                nctId = study['protocolSection']['identificationModule'].get('nctId', 'Unknown')
+                title = study['protocolSection']['identificationModule'].get('briefTitle', 'no title')
+                conditions = ', '.join(study['protocolSection']['conditionsModule'].get('conditions', ['No conditions listed']))
+                summary = study['protocolSection']['descriptionModule'].get('briefSummary', 'no summary')
+                # 場所情報の抽出
+                locations_list = study['protocolSection'].get('contactsLocationsModule', {}).get('locations', [])
+                japan_locations = []
+                for location in locations_list:
+                    if location.get('country') == 'Japan':
+                        city = location.get('city', 'Unknown City')
+                        japan_locations.append(city)
+                primaryCompletionDate = study['protocolSection']['statusModule'].get('primaryCompletionDateStruct', {}).get('date', 'Unknown Date')
+                eligibilityCriteria = study['protocolSection']['eligibilityModule'].get('eligibilityCriteria', 'Unknown')
+                data_list.append({
+                    "NCTID": nctId,
+                    "Title": title,
+                    "Primary Completion Date": primaryCompletionDate,
+                    "Cancer": conditions,
+                    "Summary": summary,
+                    "Japanes Locations": ', '.join(set(japan_locations)) if japan_locations else "No Japan locations",
+                    "Eligibility Criteria": eligibilityCriteria
+                })
+            return pd.DataFrame(data_list)
+        else:
+            print(f"API呼び出し失敗: {response.status_code}")
+            return pd.DataFrame()
+    except Exception as e:
+        print(f"基本API呼び出しエラー: {e}")
+        return pd.DataFrame()
 # エラーハンドリング付きでエージェント評価を実行する関数
 def evaluate_with_retry(agent, criteria, question, max_retries=3):
     """エラーハンドリング付きでエージェント評価を実行"""
         print(f"サンプルデータ生成エラー: {e}")
         return pd.DataFrame()
+# 基本版データ生成関数（ClinicalTrials.gov API使用、AI評価なし）
+def generate_basic_dataframe(age, sex, tumor_type, GeneMutation, Meseable, Biopsiable):
+    """基本版のデータ生成（API使用、AI評価なし）"""
+    try:
+        if not all([age, sex, tumor_type]):
+            return pd.DataFrame()
+        # 実際のAPI呼び出し
+        df = fetch_clinical_trials_basic(tumor_type)
+        if df.empty:
+            print("臨床試験データが見つかりませんでした")
+            return pd.DataFrame()
+        # AI評価なしのプレースホルダー
+        df['AgentJudgment'] = f'基本版：{age}歳{sex}の{tumor_type}患者への詳細評価にはAI機能が必要です'
+        df['AgentGrade'] = 'unclear'
+        # 列を指定した順に並び替え
+        columns_order = ['NCTID', 'AgentGrade', 'Title', 'AgentJudgment', 'Japanes Locations',
+                         'Primary Completion Date', 'Cancer', 'Summary', 'Eligibility Criteria']
+        # 存在する列のみを選択
+        available_columns = [col for col in columns_order if col in df.columns]
+        df = df[available_columns]
+        print(f"基本版評価完了。結果: {len(df)} 件")
+        return df
+    except Exception as e:
+        print(f"基本版データフレーム生成中に予期しないエラー: {e}")
+        traceback.print_exc()
+        return pd.DataFrame()
 # 完全版データ生成関数
 def generate_full_dataframe(age, sex, tumor_type, GeneMutation, Meseable, Biopsiable):
+    """完全版のデータ生成（実際のAPI使用 + AI評価）"""
     try:
         if not all([age, sex, tumor_type]):
             return pd.DataFrame()
         available_columns = [col for col in columns_order if col in df.columns]
         df = df[available_columns]
+        print(f"完全版評価完了。結果: {len(df)} 件")
         return df
     except Exception as e:
         print(f"CSV保存エラー: {e}")
         return None
+# システム状態の確認
+def get_system_status():
+    """システムの現在の状態を確認"""
+    if FULL_VERSION and env_ok:
+        return "🟢 完全版", "全機能が利用可能です"
+    elif LANGCHAIN_AVAILABLE and env_ok:
+        return "🟡 基本版", "ClinicalTrials.gov API検索が可能です（AI評価機能は制限）"
+    elif LANGCHAIN_AVAILABLE:
+        return "🟡 基本版", "API検索可能（環境変数要設定）"
+    else:
+        return "🔴 軽量版", "サンプルデータのみ表示"
 # Gradioインターフェースの作成
 with gr.Blocks(title="臨床試験適格性評価", theme=gr.themes.Soft()) as demo:
     gr.Markdown("## 🏥 臨床試験適格性評価インターフェース")
+    # システム状態表示
+    status_level, status_message = get_system_status()
+    gr.Markdown(f"**システム状態**: {status_level} - {status_message}")
+    # 機能説明
+    if FULL_VERSION:
+        gr.Markdown("✅ **利用可能機能**: リアルタイム検索 + AI適格性評価 + データエクスポート")
+    elif LANGCHAIN_AVAILABLE:
+        gr.Markdown("🔧 **利用可能機能**: ClinicalTrials.gov検索 + 基本評価 + データエクスポート")
     else:
+        gr.Markdown("📋 **利用可能機能**: サンプルデータ表示 + フィルタリング")
+    gr.Markdown("💡 **使用方法**: 患者情報を入力してボタンをクリックしてください。")
     # 各種入力フィールド
     with gr.Row():
     # ボタン類
     with gr.Row():
+        if FULL_VERSION:
+            generate_button = gr.Button("🔍 Generate Clinical Trials Data (AI評価付き)", variant="primary")
+        elif LANGCHAIN_AVAILABLE:
+            generate_button = gr.Button("📡 Generate Clinical Trials Data (基本版)", variant="primary")
         else:
             generate_button = gr.Button("📋 Generate Sample Data", variant="primary")
     def update_dataframe_and_state(age, sex, tumor_type, gene_mutation, measurable, biopsiable):
         """データフレーム生成と状態更新"""
         try:
+            if FULL_VERSION:
+                progress_text.value = "🔍 実際の臨床試験データを検索中（AI評価付き）..."
                 df = generate_full_dataframe(age, sex, tumor_type, gene_mutation, measurable, biopsiable)
+            elif LANGCHAIN_AVAILABLE:
+                progress_text.value = "📡 ClinicalTrials.govから基本データを検索中..."
+                df = generate_basic_dataframe(age, sex, tumor_type, gene_mutation, measurable, biopsiable)
             else:
                 progress_text.value = "📋 サンプルデータを生成中..."
                 df = generate_sample_dataframe(age, sex, tumor_type, gene_mutation, measurable, biopsiable)
     # フッター情報
     gr.Markdown("---")
+    with gr.Row():
+        gr.Markdown("🔬 **技術情報**: ClinicalTrials.gov API, LangChain, Groq/OpenAI API使用")
+        gr.Markdown("📝 **依存関係状況**: " + ("LangChain利用可能" if LANGCHAIN_AVAILABLE else "基本ライブラリのみ"))
 if __name__ == "__main__":
     demo.launch(

requirements.txt CHANGED Viewed

@@ -1,30 +1,5 @@
-# Stage 3: 完全版 requirements.txt
 gradio==4.36.1
 numpy==1.21.6
 pandas==1.3.5
 requests==2.31.0
-# LangChain ecosystem
-langchain==0.1.20
-langchain-community==0.0.38
-langchain-core==0.1.52
-langchain-openai==0.1.7
-langchain-groq==0.1.5
-langchain-text-splitters==0.0.1
-# LLM providers
-openai==1.12.0
-groq==0.4.2
-# Database utilities
-SQLAlchemy==2.0.23
-# Pydantic
-pydantic==2.5.3
-# Text processing
-tiktoken==0.5.2
-# Utilities
-tenacity==8.2.3
-packaging==23.0.0

+# Stage 3A: 最小限依存関係（段階的デプロイ用）
 gradio==4.36.1
 numpy==1.21.6
 pandas==1.3.5
 requests==2.31.0

requirements_stage3b.txt ADDED Viewed

	@@ -0,0 +1,28 @@

+# Stage 3B: LangChain追加版（段階的デプロイ用）
+gradio==4.36.1
+numpy==1.21.6
+pandas==1.3.5
+requests==2.31.0
+# LangChain ecosystem（最新安定版）
+langchain==0.2.16
+langchain-community==0.2.16
+langchain-core==0.2.38
+langchain-openai==0.1.23
+langchain-groq==0.1.9
+# LLM providers
+openai>=1.0.0,<2.0.0
+groq>=0.4.0
+# Database utilities
+SQLAlchemy>=2.0.0,<3.0.0
+# Pydantic（LangChain互換性のため）
+pydantic>=2.5.0,<3.0.0
+# Text processing
+tiktoken>=0.4.0
+# Utilities
+tenacity>=8.0.0