Duplicated from ggml-org/gguf-my-repo
0b1e565 4c4c78d
1
2
3
4
5
cd llama.cpp LLAMA_CUDA=1 make -j llama-quantize llama-gguf-split llama-imatrix cd .. python app.py