rinna-youri-7b-chat-gguf

rinnaさんが公開しているyouri-7b-chatのggufフォーマット変換版です。

モデル一覧

GGUF版
mmnga/rinna-youri-7b-gguf
mmnga/rinna-youri-7b-instruction-gguf
mmnga/rinna-youri-7b-chat-gguf

Usage

git clone https://github.com/ggerganov/llama.cpp.git
cd llama.cpp
make -j
./main -m 'rinna-youri-7b-chat-q4_0.gguf' -n 128 -p 'ユーザー:今日の夕食のレシピをご紹介して システム:' --top_p 0.9 --temp 0.7 --repeat-penalty 1.2
@misc{RinnaYouri7bInstruction,, 
    url={https://huggingface.co/rinna/youri-7b-instruction}, 
    title={rinna/youri-7b-instruction}, 
    author={Zhao, Tianyu and Sawada, Kei}
}

License

The llama2 license

Downloads last month
155
GGUF
Model size
6.74B params
Architecture
llama

2-bit

3-bit

4-bit

5-bit

6-bit

8-bit

Inference API
Unable to determine this model's library. Check the docs .