Hugging Face
Models
Datasets
Spaces
Posts
Docs
Enterprise
Pricing
Log In
Sign Up
Seikaijyu
/
RWKV-x060-World-3B-v2.1-Claude-nsfw.roleplay
like
30
Chinese
Not-For-All-Audiences
License:
mit
Model card
Files
Files and versions
Community
1
模型说明
基于RWKV6-v2.1-3B 全新基模微调的nsfw语C模型
非常感谢
某不知名的神秘网友
提供的784条Claude超长上下文语料(单条长度超过120k),此模型也是基于该语料进行的实验性质微调
使用7k长上下文微调19epoch后loss为1.7得到的模型
因为超长上下文,继续微调应该还能提升效果,暂时只做测试,后续我会进行全面微调,敬请期待
效果如下:
注意:使用该模型需要自定义上文,以下演示回复模型输出的第一句到第二句都为手动定义
神里绫华
补充说明
因为此模型使用纯粹的nsfw多轮对话数据微调,生成会偏向nsfw,这是正常现象
此模型需要手动设定上文才能有良好表现,模型回复会与上文回复类似
推荐如下格式使用模型(不需要设置角色名称,因为让模型以第三人称视角回复效果更好)
推荐参数如下:
Temperature=2-3之间
Top_P=0.55-0.65之间
Presence Penalty=0.4-0之间
Frequency Penalty=0.8-1.2之间
模型说明
基于RWKV6-v2.1-3B 全新基模微调的nsfw语C模型
非常感谢
某不知名的神秘网友
提供的784条Claude超长上下文语料(单条长度超过120k),此模型也是基于该语料进行的实验性质微调
使用7k长上下文微调19epoch后loss为1.7得到的模型
因为超长上下文,继续微调应该还能提升效果,暂时只做测试,后续我会进行全面微调,敬请期待
效果如下:
注意:使用该模型需要自定义上文,以下演示回复模型输出的第一句到第二句都为手动定义
神里绫华
补充说明
因为此模型使用纯粹的nsfw多轮对话数据微调,生成会偏向nsfw,这是正常现象
此模型需要手动设定上文才能有良好表现,模型回复会与上文回复类似
推荐如下格式使用模型(不需要设置角色名称,因为让模型以第三人称视角回复效果更好)
System: User: Assistant:
推荐参数如下:
Temperature=2-3之间
Top_P=0.55-0.65之间
Presence Penalty=0.4-0之间
Frequency Penalty=0.8-1.2之间
Downloads last month
-
Downloads are not tracked for this model.
How to track
Inference Providers
NEW
This model is not currently available via any of the supported Inference Providers.
The model cannot be deployed to the HF Inference API: The model has no library tag.
Collection including
Seikaijyu/RWKV-x060-World-3B-v2.1-Claude-nsfw.roleplay
RWKV6 Roleplay
Collection
角色扮演模型
•
6 items
•
Updated
25 days ago
•
4