Upload app.py
Browse files
app.py
CHANGED
@@ -354,7 +354,9 @@ def process_pdf_urls(urls_text: str, manual_abstract: str = "") -> str:
|
|
354 |
return f"處理錯誤: {str(e)}"
|
355 |
|
356 |
# Gradio界面
|
357 |
-
with gr.Blocks(title="PDF資料處理器", theme=gr.themes.Soft()) as demo:
|
|
|
|
|
358 |
with gr.Tabs():
|
359 |
# JSON處理標籤頁
|
360 |
with gr.TabItem("JSON資料處理"):
|
@@ -545,62 +547,7 @@ with gr.Blocks(title="PDF資料處理器", theme=gr.themes.Soft()) as demo:
|
|
545 |
outputs=[output_json2, save_status2, download_file2]
|
546 |
)
|
547 |
|
548 |
-
gr.Markdown(""
|
549 |
-
## 使用說明:
|
550 |
-
|
551 |
-
### 🆕 新功能特色:
|
552 |
-
- **🔄 智能檔名**: 自動使用論文集名稱或PDF標題作為JSON檔名
|
553 |
-
- **📝 手動摘要**: 可貼上現有摘要,避免重複提取
|
554 |
-
- **⚡ 高效處理**: 有摘要就不用下載PDF,節省時間
|
555 |
-
|
556 |
-
### JSON資料處理模式:
|
557 |
-
1. 將現有的JSON資料貼入文本框
|
558 |
-
2. **可選**: 在摘要欄位貼上已知的摘要內容
|
559 |
-
3. 勾選"自動使用論文集名稱作為檔名"(推薦)
|
560 |
-
4. 系統會根據下載位置自動獲取PDF並補充缺失欄位
|
561 |
-
5. 如果已提供摘要,系統將跳過PDF摘要提取,節省處理時間
|
562 |
-
|
563 |
-
### PDF網址直接處理模式:
|
564 |
-
1. 直接貼入PDF網址,每行一個
|
565 |
-
2. **可選**: 在摘要欄位貼上統一的摘要內容
|
566 |
-
3. 勾選"自動使用第一個PDF標題作為檔名"(推薦)
|
567 |
-
4. 系統會自動下載並提取完整資訊
|
568 |
-
5. 如果已提供摘要,將應用到所有PDF條目
|
569 |
-
|
570 |
-
### 檔名規則:
|
571 |
-
- **自動檔名**: 使用論文集名稱或PDF標題,自動清理特殊字符
|
572 |
-
- **自訂檔名**: 取消勾選自動檔名後可手動指定
|
573 |
-
- 檔名會自動加上`.json`副檔名
|
574 |
-
- 特殊字符會被替換為安全字符
|
575 |
-
|
576 |
-
### 摘要處理優先順序:
|
577 |
-
1. **手動輸入的摘要** (最高優先級)
|
578 |
-
2. PDF中提取的摘要
|
579 |
-
3. 預設訊息 ("無摘要資訊")
|
580 |
-
|
581 |
-
## 注意事項:
|
582 |
-
- 提供手動摘要可大幅加快處理速度
|
583 |
-
- 自動檔名會避免檔案系統不支援的字符
|
584 |
-
- 建議分批處理大量文件以獲得最佳效果
|
585 |
-
- 系統會自動清理重複的標題內容
|
586 |
-
|
587 |
-
## 範例使用情境:
|
588 |
-
|
589 |
-
### 情境1: 已知摘要的快速處理
|
590 |
-
```
|
591 |
-
有現成的論文摘要 → 貼入摘要欄位 → 勾選自動檔名 → 快速處理
|
592 |
-
```
|
593 |
-
|
594 |
-
### 情境2: 完全自動化處理
|
595 |
-
```
|
596 |
-
只有PDF網址 → 留空摘要欄位 → 勾選自動檔名 → 全自動提取
|
597 |
-
```
|
598 |
-
|
599 |
-
### 情境3: 批量處理相同摘要
|
600 |
-
```
|
601 |
-
多個PDF同一主題 → 輸入統一摘要 → 批量處理 → 節省時間
|
602 |
-
```
|
603 |
-
""")
|
604 |
|
605 |
if __name__ == "__main__":
|
606 |
demo.launch()
|
|
|
354 |
return f"處理錯誤: {str(e)}"
|
355 |
|
356 |
# Gradio界面
|
357 |
+
with gr.Blocks(title="PDF資料處理器", theme=gr.themes.Soft()) as demo:
|
358 |
+
gr.Markdown("# PDF論文資料自動處理系統")
|
359 |
+
|
360 |
with gr.Tabs():
|
361 |
# JSON處理標籤頁
|
362 |
with gr.TabItem("JSON資料處理"):
|
|
|
547 |
outputs=[output_json2, save_status2, download_file2]
|
548 |
)
|
549 |
|
550 |
+
gr.Markdown("## 基本功能:JSON處理 | PDF網址處理 | 自動檔名 | 手動摘要")
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
551 |
|
552 |
if __name__ == "__main__":
|
553 |
demo.launch()
|