Spaces:
Sleeping
Sleeping
✨ feat: READMEにLLM評価システムに関する情報を追加
Browse files- LLMを評価者として用いる高度な品質評価システムに関するセクションを追加しました。
- システムの概要、特徴、評価基準、使用方法、および関連ノートブックへのリンクを記載しました。
- ノートブックへのリンクを更新し、新しいLLM評価システムのノートブックへのリンクを追加しました。
README.md
CHANGED
@@ -101,7 +101,15 @@ license: mit
|
|
101 |
- → 文脈情報を活用した高精度な質問生成と回答の整合性チェック
|
102 |
- → 詳細は [`context_aware_Reflexive_qa_generator_V2.md`](sandbox/context_aware_Reflexive_qa_generator_V2.md) をご参照ください。
|
103 |
- [📒ノートブックはこちら](https://colab.research.google.com/drive/1OYdgAuXHbl-0LUJgkLl_VqknaAEmAm0S?usp=sharing)
|
104 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
105 |
## 🛠️ 環境構築
|
106 |
|
107 |
1. リポジトリのクローン:
|
|
|
101 |
- → 文脈情報を活用した高精度な質問生成と回答の整合性チェック
|
102 |
- → 詳細は [`context_aware_Reflexive_qa_generator_V2.md`](sandbox/context_aware_Reflexive_qa_generator_V2.md) をご参照ください。
|
103 |
- [📒ノートブックはこちら](https://colab.research.google.com/drive/1OYdgAuXHbl-0LUJgkLl_VqknaAEmAm0S?usp=sharing)
|
104 |
+
|
105 |
+
### LLM評価システム (LLMs as a Judge)
|
106 |
+
- LLMを評価者として活用する高度な品質評価システム
|
107 |
+
- → 質問、模範解答、LLMの回答を4段階スケールで自動評価
|
108 |
+
- → エラーハンドリングとリトライ機能による堅牢な設計
|
109 |
+
- → CSV、HTML形式での詳細な評価レポート生成
|
110 |
+
- → 詳細は [`LLMs_as_a_Judge_TOHO_V2.md`](sandbox/LLMs_as_a_Judge_TOHO_V2.md) をご参照ください。
|
111 |
+
- [📒ノートブックはこちら](https://colab.research.google.com/drive/1Zjw3sOMa2v5RFD8dFfxMZ4NDGFoQOL7s?usp=sharing
|
112 |
+
|
113 |
## 🛠️ 環境構築
|
114 |
|
115 |
1. リポジトリのクローン:
|