Duplicated from ggml-org/gguf-my-repo
3683deb a5eaf96 4c4c78d 3683deb 4c4c78d
1
2
3
4
5
cd llama.cpp LLAMA_CUDA=1 make -j quantize gguf-split imatrix cd .. python app.py