Duplicated from ggml-org/gguf-my-repo
3683deb 5f0f1b0 4c4c78d 3683deb 4c4c78d
1
2
3
4
5
cd llama.cpp LLAMA_CUDA=1 make -j llama-quantize llama-gguf-split llama-imatrix cd .. python app.py