inu-ai
/

alpaca-guanaco-japanese-gpt-1b

@@ -11,7 +11,7 @@ tags:
 license: unknown
 datasets:
 - JosephusCheung/GuanacoDataset
-- https://github.com/shi3z/alpaca_ja
 widget:
   - text: <s>\\n以下は、タスクを説明する指示です。要求を適切に満たす応答を書きなさい。\\n[SEP]\\n指示:\\n日本で一番広い湖は？\\n[SEP]\\n応答:\\n
 ---
@@ -20,12 +20,13 @@ widget:
 1.3Bパラメータの日本語GPTモデルを使用した対話AIです。VRAM 7GB または RAM 7GB が必要で、問題なく動作すると思われます。
-rinna社の「japanese-gpt-1b」を、日本語データセット「alpaca_ja」および「GuanacoDataset」から抽出された日本語データを使用して学習させました。
 学習データやモデルを作成および配布してくださった方々に心から感謝申し上げます。
 # モデルの使用方法
-モデルの読み込み
 ```python
 import torch
@@ -36,19 +37,7 @@ tokenizer = AutoTokenizer.from_pretrained("inu-ai/alpaca-guanaco-japanese-gpt-1b
 model = AutoModelForCausalLM.from_pretrained("inu-ai/alpaca-guanaco-japanese-gpt-1b").to(device)
 ```
-- ChatGPT4によるサンプルコードと説明
-このコードは、与えられた役割指示と会話履歴に基づいて、新しい質問に対して応答を生成する機能を持っています。以下に、コードの各部分を簡単に説明します。
-1. `prepare_input` 関数は、役割指示、会話履歴、および新しい会話（質問）を受け取り、入力テキストを準備します。
-2. `format_output` 関数は、生成された応答を整形して、不要な部分を削除し、適切な形式に変換します。
-3. `generate_response` 関数は、指定された役割指示、会話履歴、および新しい会話を使用して、AIの応答を生成し、整形します。また、会話履歴を更新します。
-4. `role_instruction` は、AIに適用する役割指示のリストです。
-5. `conversation_history` は、これまでの会話履歴を格納するリストです。
-6. `questions` は、AIに質問するリストです。
-最後に、`questions`リスト内の各質問に対して、AIの応答を生成し、表示しています。
-このコードを実行すると、AIが指定された役割指示に従って、リスト内の質問に応答します。
 ```python
 MAX_LENGTH = 1024
@@ -125,8 +114,22 @@ for question in questions:
     print(response)
 ```
-出力
 ```
 Assistant:日本で一番高い山は富士山です。
 Assistant:日本で一番広い湖は琵琶湖です。湖は長さ約6,400 km、面積は約33,600 km2で、世界最大の湖です。
@@ -136,17 +139,17 @@ Assistant:ずんだもんは、東北ずん子のキャラクターです。一
 Assistant:今、私は何問目でしょうか?
 ```
-### 評価
 100回の「入力」質問を行い、それらに対する「応答」文字列が最も正確なエポックのモデルを選択しました。
 なお、サンプルコードのように「入力」が長くなると正答率が50%ぐらいに下がりました。
 | 入力                  | 応答        | 正答率[%] |
 |-----------------------|-------------|-------|
 | 日本で一番広い湖は？ | 琵琶湖     | 96    |
-| 日本で一番高い山は？ | エベレスト | 86    |
-### トレーニングのハイパーパラメータ
 学習時には以下のハイパーパラメータを使用:
 ```
@@ -169,7 +172,7 @@ python.exe transformers/examples/pytorch/language-modeling/run_clm.py ^
 	--logging_dir logs
 ```
-### フレームワークのバージョン
 - Transformers 4.28.0.dev0
 - Pytorch 2.0.0+cu117

 license: unknown
 datasets:
 - JosephusCheung/GuanacoDataset
+- tatsu-lab/alpaca
 widget:
   - text: <s>\\n以下は、タスクを説明する指示です。要求を適切に満たす応答を書きなさい。\\n[SEP]\\n指示:\\n日本で一番広い湖は？\\n[SEP]\\n応答:\\n
 ---
 1.3Bパラメータの日本語GPTモデルを使用した対話AIです。VRAM 7GB または RAM 7GB が必要で、問題なく動作すると思われます。
+rinna社の「[japanese-gpt-1b](https://huggingface.co/rinna/japanese-gpt-1b)」を、日本語データセット「[alpaca_ja](https://github.com/shi3z/alpaca_ja)」および「[GuanacoDataset](https://huggingface.co/datasets/JosephusCheung/GuanacoDataset)」から抽出された日本語データを使用して学習させました。
 学習データやモデルを作成および配布してくださった方々に心から感謝申し上げます。
 # モデルの使用方法
+## モデルの読み込み
 ```python
 import torch
 model = AutoModelForCausalLM.from_pretrained("inu-ai/alpaca-guanaco-japanese-gpt-1b").to(device)
 ```
+## ChatGPT4によるサンプルコード
 ```python
 MAX_LENGTH = 1024
     print(response)
 ```
+## ChatGPT4による説明
+このコードは、与えられた役割指示と会話履歴に基づいて、新しい質問に対して応答を生成する機能を持っています。以下に、コードの各部分を簡単に説明します。
+1. `prepare_input` 関数は、役割指示、会話履歴、および新しい会話（質問）を受け取り、入力テキストを準備します。
+2. `format_output` 関数は、生成された応答を整形して、不要な部分を削除し、適切な形式に変換します。
+3. `generate_response` 関数は、指定された役割指示、会話履歴、および新しい会話を使用して、AIの応答を生成し、整形します。また、会話履歴を更新します。
+4. `role_instruction` は、AIに適用する役割指示のリストです。
+5. `conversation_history` は、これまでの会話履歴を格納するリストです。
+6. `questions` は、AIに質問するリストです。
+最後に、`questions`リスト内の各質問に対して、AIの応答を生成し、表示しています。
+このコードを実行すると、AIが指定された役割指示に従って、リスト内の質問に応答します。
+## 出力
 ```
 Assistant:日本で一番高い山は富士山です。
 Assistant:日本で一番広い湖は琵琶湖です。湖は長さ約6,400 km、面積は約33,600 km2で、世界最大の湖です。
 Assistant:今、私は何問目でしょうか?
 ```
+# 評価
 100回の「入力」質問を行い、それらに対する「応答」文字列が最も正確なエポックのモデルを選択しました。
 なお、サンプルコードのように「入力」が長くなると正答率が50%ぐらいに下がりました。
 | 入力                  | 応答        | 正答率[%] |
 |-----------------------|-------------|-------|
 | 日本で一番広い湖は？ | 琵琶湖     | 96    |
+| 世界で一番高い山は？ | エベレスト | 86    |
+# トレーニングのハイパーパラメータ
 学習時には以下のハイパーパラメータを使用:
 ```
 	--logging_dir logs
 ```
+# フレームワークのバージョン
 - Transformers 4.28.0.dev0
 - Pytorch 2.0.0+cu117