ijohn07
/

Llama-3.1-Minitron-4B-Width-Base-Q5_K_M-GGUF

Inference Endpoints

Model card Files Files and versions Community

ijohn07 commited on Sep 4, 2024

Commit

b31cebe

·

verified ·

1 Parent(s): 2ff0057

Update README.md

Files changed (1) hide show

README.md +13 -10

README.md CHANGED Viewed

@@ -1,12 +1,15 @@
----
-base_model: nvidia/Llama-3.1-Minitron-4B-Width-Base
-license: other
-license_name: nvidia-open-model-license
-license_link: https://developer.download.nvidia.com/licenses/nvidia-open-model-license-agreement-june-2024.pdf
-tags:
-- llama-cpp
-- gguf-my-repo
----
 # ijohn07/Llama-3.1-Minitron-4B-Width-Base-Q5_K_M-GGUF
 This model was converted to GGUF format from [`nvidia/Llama-3.1-Minitron-4B-Width-Base`](https://huggingface.co/nvidia/Llama-3.1-Minitron-4B-Width-Base) using llama.cpp via the ggml.ai's [GGUF-my-repo](https://huggingface.co/spaces/ggml-org/gguf-my-repo) space.
@@ -50,4 +53,4 @@ Step 3: Run inference through the main binary.
 or
 ```
 ./llama-server --hf-repo ijohn07/Llama-3.1-Minitron-4B-Width-Base-Q5_K_M-GGUF --hf-file llama-3.1-minitron-4b-width-base-q5_k_m-imat.gguf -c 2048
-```

+---
+base_model: nvidia/Llama-3.1-Minitron-4B-Width-Base
+license: other
+license_name: nvidia-open-model-license
+license_link: >-
+  https://developer.download.nvidia.com/licenses/nvidia-open-model-license-agreement-june-2024.pdf
+tags:
+- llama-cpp
+- gguf-my-repo
+datasets:
+- Gryphe/Opus-WritingPrompts
+---
 # ijohn07/Llama-3.1-Minitron-4B-Width-Base-Q5_K_M-GGUF
 This model was converted to GGUF format from [`nvidia/Llama-3.1-Minitron-4B-Width-Base`](https://huggingface.co/nvidia/Llama-3.1-Minitron-4B-Width-Base) using llama.cpp via the ggml.ai's [GGUF-my-repo](https://huggingface.co/spaces/ggml-org/gguf-my-repo) space.
 or
 ```
 ./llama-server --hf-repo ijohn07/Llama-3.1-Minitron-4B-Width-Base-Q5_K_M-GGUF --hf-file llama-3.1-minitron-4b-width-base-q5_k_m-imat.gguf -c 2048
+```