OpenMOSE
/

RWKV-x060-JPN-RolePlay

Model card Files Files and versions Community

OpenMOSE commited on Sep 17, 2024

Commit

414d1dc

·

verified ·

1 Parent(s): f95b1f1

Update README.md

Files changed (1) hide show

README.md +3 -0

README.md CHANGED Viewed

@@ -22,6 +22,8 @@ license: apache-2.0
 ## データセット
 - 使用データセット: open_contents_datasetsの(c)Rosebleu様のデータセット
 - データ処理: キャラクターごとの会話並び替えと会話履歴ごとの1Pair生成
 ## 使用方法
 - システムプロンプトにキャラクター情報を入力することでキャラクターになりきり可能？
@@ -32,6 +34,7 @@ license: apache-2.0
 - 自己蒸留LogitsをLossに加えることでSFTLossとKLLossのバランスを調整
 - ハイパーパラメータによるSFTデータセットの学習度と元のモデル維持度のトレードオフ制御
 - LR 2e-5 to 1e-6, top-k=100 temperature=2.0 alpha=0.85
 ## 制限事項と注意点
 - 実験的なモデルであり、性能や挙動が安定しない可能性があります。

 ## データセット
 - 使用データセット: open_contents_datasetsの(c)Rosebleu様のデータセット
 - データ処理: キャラクターごとの会話並び替えと会話履歴ごとの1Pair生成
+- Topk100のLogitsデータセットを作成（70GBほど）
+- 処理後のトータルデータセット数300000Pair
 ## 使用方法
 - システムプロンプトにキャラクター情報を入力することでキャラクターになりきり可能？
 - 自己蒸留LogitsをLossに加えることでSFTLossとKLLossのバランスを調整
 - ハイパーパラメータによるSFTデータセットの学習度と元のモデル維持度のトレードオフ制御
 - LR 2e-5 to 1e-6, top-k=100 temperature=2.0 alpha=0.85
+- Train Epoch 2
 ## 制限事項と注意点
 - 実験的なモデルであり、性能や挙動が安定しない可能性があります。