mmnga
/

gemma-1.1-7b-it-gguf

Inference Endpoints

Model card Files Files and versions Community

mmnga commited on Apr 6, 2024

Commit

245c650

·

verified ·

1 Parent(s): 91c697a

Update README.md

Files changed (1) hide show

README.md +28 -0

README.md CHANGED Viewed

@@ -1,3 +1,31 @@
 ---
 license: gemma
 ---

 ---
 license: gemma
+license_name: gemma-terms-of-use
+license_link: https://www.kaggle.com/models/google/gemma/license/consent
+language:
+- en
+- ja
 ---
+# gemma-1.1-7b-it-gguf
+[googleさんが公開しているgemma-1.1-7b-it](https://huggingface.co/google/gemma-1.1-7b-it)のggufフォーマット変換版です。
+**現在量子化された出力が不安定な問題があるらしくQ8_0を推奨します。**
+[gemma : token_embd.weight テンソルに Q8_0 を使用します #5650](https://github.com/ggerganov/llama.cpp/pull/5650)
+# Licence
+[gemma-terms-of-use 利用規約](https://ai.google.dev/gemma/terms)をご利用前に必ずご確認ください。
+# 他のモデル
+[mmnga/gemma-2b-it-gguf](https://huggingface.co/mmnga/gemma-2b-it-gguf)
+[mmnga/gemma-7b-it-gguf](https://huggingface.co/mmnga/gemma-7b-it-gguf)
+[mmnga/gemma-1.1-7b-it-gguf](https://huggingface.co/mmnga/gemma-1.1-7b-it-gguf)
+## Usage
+```
+git clone https://github.com/ggerganov/llama.cpp.git
+cd llama.cpp
+make -j
+./main -m 'gemma-1.1-7b-it-q4_0.gguf' -p "<start_of_turn>user\n日本の文化を１０個教えて。<end_of_turn>\n<start_of_turn>model\n" -n 128
+```