dseditor commited on
Commit
20438fb
·
verified ·
1 Parent(s): d5fdc94

Upload app.py

Browse files
Files changed (1) hide show
  1. app.py +4 -57
app.py CHANGED
@@ -354,7 +354,9 @@ def process_pdf_urls(urls_text: str, manual_abstract: str = "") -> str:
354
  return f"處理錯誤: {str(e)}"
355
 
356
  # Gradio界面
357
- with gr.Blocks(title="PDF資料處理器", theme=gr.themes.Soft()) as demo:
 
 
358
  with gr.Tabs():
359
  # JSON處理標籤頁
360
  with gr.TabItem("JSON資料處理"):
@@ -545,62 +547,7 @@ with gr.Blocks(title="PDF資料處理器", theme=gr.themes.Soft()) as demo:
545
  outputs=[output_json2, save_status2, download_file2]
546
  )
547
 
548
- gr.Markdown("""
549
- ## 使用說明:
550
-
551
- ### 🆕 新功能特色:
552
- - **🔄 智能檔名**: 自動使用論文集名稱或PDF標題作為JSON檔名
553
- - **📝 手動摘要**: 可貼上現有摘要,避免重複提取
554
- - **⚡ 高效處理**: 有摘要就不用下載PDF,節省時間
555
-
556
- ### JSON資料處理模式:
557
- 1. 將現有的JSON資料貼入文本框
558
- 2. **可選**: 在摘要欄位貼上已知的摘要內容
559
- 3. 勾選"自動使用論文集名稱作為檔名"(推薦)
560
- 4. 系統會根據下載位置自動獲取PDF並補充缺失欄位
561
- 5. 如果已提供摘要,系統將跳過PDF摘要提取,節省處理時間
562
-
563
- ### PDF網址直接處理模式:
564
- 1. 直接貼入PDF網址,每行一個
565
- 2. **可選**: 在摘要欄位貼上統一的摘要內容
566
- 3. 勾選"自動使用第一個PDF標題作為檔名"(推薦)
567
- 4. 系統會自動下載並提取完整資訊
568
- 5. 如果已提供摘要,將應用到所有PDF條目
569
-
570
- ### 檔名規則:
571
- - **自動檔名**: 使用論文集名稱或PDF標題,自動清理特殊字符
572
- - **自訂檔名**: 取消勾選自動檔名後可手動指定
573
- - 檔名會自動加上`.json`副檔名
574
- - 特殊字符會被替換為安全字符
575
-
576
- ### 摘要處理優先順序:
577
- 1. **手動輸入的摘要** (最高優先級)
578
- 2. PDF中提取的摘要
579
- 3. 預設訊息 ("無摘要資訊")
580
-
581
- ## 注意事項:
582
- - 提供手動摘要可大幅加快處理速度
583
- - 自動檔名會避免檔案系統不支援的字符
584
- - 建議分批處理大量文件以獲得最佳效果
585
- - 系統會自動清理重複的標題內容
586
-
587
- ## 範例使用情境:
588
-
589
- ### 情境1: 已知摘要的快速處理
590
- ```
591
- 有現成的論文摘要 → 貼入摘要欄位 → 勾選自動檔名 → 快速處理
592
- ```
593
-
594
- ### 情境2: 完全自動化處理
595
- ```
596
- 只有PDF網址 → 留空摘要欄位 → 勾選自動檔名 → 全自動提取
597
- ```
598
-
599
- ### 情境3: 批量處理相同摘要
600
- ```
601
- 多個PDF同一主題 → 輸入統一摘要 → 批量處理 → 節省時間
602
- ```
603
- """)
604
 
605
  if __name__ == "__main__":
606
  demo.launch()
 
354
  return f"處理錯誤: {str(e)}"
355
 
356
  # Gradio界面
357
+ with gr.Blocks(title="PDF資料處理器", theme=gr.themes.Soft()) as demo:
358
+ gr.Markdown("# PDF論文資料自動處理系統")
359
+
360
  with gr.Tabs():
361
  # JSON處理標籤頁
362
  with gr.TabItem("JSON資料處理"):
 
547
  outputs=[output_json2, save_status2, download_file2]
548
  )
549
 
550
+ gr.Markdown("## 基本功能:JSON處理 | PDF網址處理 | 自動檔名 | 手動摘要")
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
551
 
552
  if __name__ == "__main__":
553
  demo.launch()