tugaa commited on
Commit
be44d6b
·
verified ·
1 Parent(s): e25c3ed

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +76 -3
README.md CHANGED
@@ -1,3 +1,76 @@
1
- ---
2
- license: mit
3
- ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ # 多言語・簡易多モーダルWeb参照AIエージェント(Hugging Face Spaces対応)
2
+
3
+ ## 概要
4
+
5
+ このプロジェクトは、テキスト・画像・動画を入力として受け取り、多言語でのWeb情報検索と要約を並列に行い、指定された言語で結果を統合・出力するAIエージェントです。
6
+
7
+ **Hugging Face Spaces(無料ティア)でのデプロイを想定**して設計されています。
8
+
9
+ ---
10
+
11
+ ## 主な機能
12
+
13
+ * テキスト、画像、動画のマルチモーダル入力に対応
14
+ * 入力言語の自動検出と処理
15
+ * タスクの自動分解と並列処理(非同期実行)
16
+ * Web検索とページ要約(Serper API + BeautifulSoup)
17
+ * アップロードされた画像・動画のLLMによる簡易分析(GPT-4oなど)
18
+ * 指定言語での統合出力(日本語、英語、スペイン語、フランス語、中国語)
19
+
20
+ ---
21
+
22
+ ## 使用技術
23
+
24
+ * **フロントエンド/UI**: Gradio
25
+ * **バックエンド**: Python + asyncio + OpenAI API
26
+ * **Web検索**: Serper API([https://serper.dev)](https://serper.dev))
27
+ * **LLM**: GPT-4o(openaiライブラリ経由)
28
+ * **画像処理**: Pillow(軽量な画像サイズ取得など)
29
+ * **動画処理**: MoviePy(キーフレーム抽出)
30
+
31
+ ---
32
+
33
+ ## インストールと実行方法
34
+
35
+ ```bash
36
+ # 依存ライブラリのインストール
37
+ pip install -r requirements.txt
38
+
39
+ # 環境変数の設定(.envファイルまたはシェルで)
40
+ export OPENAI_API_KEY=your_openai_key
41
+ export SERPER_API_KEY=your_serper_key
42
+
43
+ # アプリ起動
44
+ python app.py
45
+ ```
46
+
47
+ ---
48
+
49
+ ## Hugging Face Spacesでの注意点
50
+
51
+ * **無料ティアでは** CPUリソースとディスク容量に制限があります。
52
+ * 画像・動画の処理はアップロードされた小ファイル(短時間の.mp4等)に限定してください。
53
+ * Webからの画像・動画の**ダウンロード・保存は行わず、URLと要約のみ表示**されます。
54
+ * GPT-4oの使用により画像・動画内容の要約は可能ですが、コスト・速度に注意。
55
+ * 外部APIキーは Spaces の Secrets に登録してください(例: `OPENAI_API_KEY`, `SERPER_API_KEY`)。
56
+
57
+ ---
58
+
59
+ ## 今後の拡張可能性
60
+
61
+ * Gemini API や Claude API 対応
62
+ * 音声抽出および文字起こし対応(短時間動画)
63
+ * 出力形式のカスタマイズ(Markdown, JSONなど)
64
+
65
+ ---
66
+
67
+ ## 作者
68
+
69
+ tugaa
70
+
71
+ ---
72
+
73
+ ## ライセンス
74
+
75
+ MIT
76
+