huihui-ai
/

Marco-o1-abliterated

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

huihui-ai commited on Nov 23, 2024

Commit

774554a

·

verified ·

1 Parent(s): 8214105

Update README.md

Files changed (1) hide show

README.md +2 -1

README.md CHANGED Viewed

@@ -22,7 +22,8 @@ huggingface-cli download huihui-ai/Marco-o1-abliterated --local-dir ./huihui-ai/
 ```
 python convert_hf_to_gguf.py huihui-ai/Marco-o1-abliterated --outfile huihui-ai/Marco-o1-abliterated/ggml-model-f16.gguf --outtype f16
 ```
-3. Use the [llama.cpp](https://github.com/ggerganov/llama.cpp) quantitative program to quantitative model (llama-quantize needs to be compiled.), [quant_option](https://github.com/ggerganov/examples/quantize/quantize.cpp)
 ```
 llama-quantize huihui-ai/Marco-o1-abliterated/ggml-model-f16.gguf  huihui-ai/Marco-o1-abliterated/ggml-model-Q4_K_M.gguf Q4_K_M
 ```

 ```
 python convert_hf_to_gguf.py huihui-ai/Marco-o1-abliterated --outfile huihui-ai/Marco-o1-abliterated/ggml-model-f16.gguf --outtype f16
 ```
+3. Use the [llama.cpp](https://github.com/ggerganov/llama.cpp) quantitative program to quantitative model (llama-quantize needs to be compiled.),
+4. [quant option](https://github.com/ggerganov/llama.cpp/blob/master/examples/quantize/quantize.cpp).
 ```
 llama-quantize huihui-ai/Marco-o1-abliterated/ggml-model-f16.gguf  huihui-ai/Marco-o1-abliterated/ggml-model-Q4_K_M.gguf Q4_K_M
 ```