taobao-mnn
/

gemma-2-9b-it-MNN

Text Generation

English

chat

Model card Files Files and versions Community

zhaode commited on 10 days ago

Commit

8db5d0a

verified ·

1 Parent(s): df3a5a2

Upload folder using huggingface_hub

Browse files

Files changed (2) hide show

.gitattributes +37 -40
README.md +42 -42

.gitattributes CHANGED Viewed

@@ -1,41 +1,38 @@
 *.7z filter=lfs diff=lfs merge=lfs -text
-    *.arrow filter=lfs diff=lfs merge=lfs -text
-    *.bin filter=lfs diff=lfs merge=lfs -text
-    *.bin.* filter=lfs diff=lfs merge=lfs -text
-    *.bz2 filter=lfs diff=lfs merge=lfs -text
-    *.ftz filter=lfs diff=lfs merge=lfs -text
-    *.gz filter=lfs diff=lfs merge=lfs -text
-    *.h5 filter=lfs diff=lfs merge=lfs -text
-    *.joblib filter=lfs diff=lfs merge=lfs -text
-    *.lfs.* filter=lfs diff=lfs merge=lfs -text
-    *.model filter=lfs diff=lfs merge=lfs -text
-    *.msgpack filter=lfs diff=lfs merge=lfs -text
-    *.onnx filter=lfs diff=lfs merge=lfs -text
-    *.ot filter=lfs diff=lfs merge=lfs -text
-    *.parquet filter=lfs diff=lfs merge=lfs -text
-    *.pb filter=lfs diff=lfs merge=lfs -text
-    *.pt filter=lfs diff=lfs merge=lfs -text
-    *.pth filter=lfs diff=lfs merge=lfs -text
-    *.rar filter=lfs diff=lfs merge=lfs -text
-    saved_model/**/* filter=lfs diff=lfs merge=lfs -text
-    *.tar.* filter=lfs diff=lfs merge=lfs -text
-    *.tflite filter=lfs diff=lfs merge=lfs -text
-    *.tgz filter=lfs diff=lfs merge=lfs -text
-    *.xz filter=lfs diff=lfs merge=lfs -text
-    *.zip filter=lfs diff=lfs merge=lfs -text
-    *.zstandard filter=lfs diff=lfs merge=lfs -text
-    *.tfevents* filter=lfs diff=lfs merge=lfs -text
-    *.db* filter=lfs diff=lfs merge=lfs -text
-    *.ark* filter=lfs diff=lfs merge=lfs -text
-    **/*ckpt*data* filter=lfs diff=lfs merge=lfs -text
-    **/*ckpt*.meta filter=lfs diff=lfs merge=lfs -text
-    **/*ckpt*.index filter=lfs diff=lfs merge=lfs -text
-    *.safetensors filter=lfs diff=lfs merge=lfs -text
-    *.ckpt filter=lfs diff=lfs merge=lfs -text
-    *.mnn filter=lfs diff=lfs merge=lfs -text
-    *.mnn.* filter=lfs diff=lfs merge=lfs -text
-    *.weight filter=lfs diff=lfs merge=lfs -text
-    embeddings_bf16.bin filter=lfs diff=lfs merge=lfs -text
-llm.mnn filter=lfs diff=lfs merge=lfs -text
-llm.mnn.json filter=lfs diff=lfs merge=lfs -text
-llm.mnn.weight filter=lfs diff=lfs merge=lfs -text

 *.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bin.* filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zstandard filter=lfs diff=lfs merge=lfs -text
+*.tfevents* filter=lfs diff=lfs merge=lfs -text
+*.db* filter=lfs diff=lfs merge=lfs -text
+*.ark* filter=lfs diff=lfs merge=lfs -text
+**/*ckpt*data* filter=lfs diff=lfs merge=lfs -text
+**/*ckpt*.meta filter=lfs diff=lfs merge=lfs -text
+**/*ckpt*.index filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.mnn filter=lfs diff=lfs merge=lfs -text
+*.mnn.* filter=lfs diff=lfs merge=lfs -text
+*.weight filter=lfs diff=lfs merge=lfs -text

README.md CHANGED Viewed

@@ -1,51 +1,51 @@
 ---
-    license: apache-2.0
-    language:
-    - en
-    pipeline_tag: text-generation
-    tags:
-    - chat
-    ---
-    # gemma-2-9b-it-MNN
-    ## Introduction
-    This model is a 4-bit quantized version of the MNN model exported from /home/yanxing/model/public-mnn/gemma-2-9b-it using [llmexport](https://github.com/alibaba/MNN/tree/master/transformers/llm/export).
-    ## Download
-    ```bash
-    # install huggingface
-    pip install huggingface
-    ```
-    ```bash
-    # shell download
-    huggingface download --model 'taobao-mnn/gemma-2-9b-it-MNN' --local_dir 'path/to/dir'
-    ```
-    ```python
-    # SDK download
-    from huggingface_hub import snapshot_download
-    model_dir = snapshot_download('taobao-mnn/gemma-2-9b-it-MNN')
-    ```
-    ```bash
-    # git clone
-    git clone https://www.modelscope.cn/taobao-mnn/gemma-2-9b-it-MNN
-    ```
-    ## Usage
-    ```bash
-    # clone MNN source
-    git clone https://github.com/alibaba/MNN.git
-    # compile
-    cd MNN
-    mkdir build && cd build
-    cmake .. -DMNN_LOW_MEMORY=true -DMNN_CPU_WEIGHT_DEQUANT_GEMM=true -DMNN_BUILD_LLM=true -DMNN_SUPPORT_TRANSFORMER_FUSE=true
-    make -j
-    # run
-    ./llm_demo /path/to/gemma-2-9b-it-MNN/config.json prompt.txt
-    ```
-    ## Document
-    [MNN-LLM](https://mnn-docs.readthedocs.io/en/latest/transformers/llm.html#)

 ---
+license: apache-2.0
+language:
+- en
+pipeline_tag: text-generation
+tags:
+- chat
+---
+# gemma-2-9b-it-MNN
+## Introduction
+This model is a 4-bit quantized version of the MNN model exported from /home/yanxing/model/public-mnn/gemma-2-9b-it using [llmexport](https://github.com/alibaba/MNN/tree/master/transformers/llm/export).
+## Download
+```bash
+# install huggingface
+pip install huggingface
+```
+```bash
+# shell download
+huggingface download --model 'taobao-mnn/gemma-2-9b-it-MNN' --local_dir 'path/to/dir'
+```
+```python
+# SDK download
+from huggingface_hub import snapshot_download
+model_dir = snapshot_download('taobao-mnn/gemma-2-9b-it-MNN')
+```
+```bash
+# git clone
+git clone https://www.modelscope.cn/taobao-mnn/gemma-2-9b-it-MNN
+```
+## Usage
+```bash
+# clone MNN source
+git clone https://github.com/alibaba/MNN.git
+# compile
+cd MNN
+mkdir build && cd build
+cmake .. -DMNN_LOW_MEMORY=true -DMNN_CPU_WEIGHT_DEQUANT_GEMM=true -DMNN_BUILD_LLM=true -DMNN_SUPPORT_TRANSFORMER_FUSE=true
+make -j
+# run
+./llm_demo /path/to/gemma-2-9b-it-MNN/config.json prompt.txt
+```
+## Document
+[MNN-LLM](https://mnn-docs.readthedocs.io/en/latest/transformers/llm.html#)