PatronusAI
/

glider-gguf

Model card Files Files and versions

DarshanDeshpande commited on Dec 19, 2024

Commit

06b6a01

·

verified ·

1 Parent(s): da98e26

Upload Q8_0 GGUF model

Files changed (3) hide show

.gitattributes +1 -0
README.md +23 -3
glider_Q8_0.gguf +3 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+glider_Q8_0.gguf filter=lfs diff=lfs merge=lfs -text

README.md CHANGED Viewed

@@ -1,3 +1,23 @@
----
-license: cc-by-nc-4.0
----

+---
+license: cc-by-nc-4.0
+base_model:
+- PatronusAI/glider
+---
+Available GGUF versions for the [PatronusAI/glider](https://huggingface.co/PatronusAI/glider) model: [`BF16`, `Q8_0`, `Q5_K_M`, `Q4_K_M`]
+How to load your desired quantized model:
+1. Select the appropraite GGUF quantization from the available list above
+2. Run the following code:
+```bash
+from transformers import AutoModelForCausalLM
+model = AutoModelForCausalLM.from_pretrained("PatronusAI/glider-gguf", gguf_file="glider_{version_from_list}.gguf")
+```
+For loading the Q8_0 version, this script will change to:
+```bash
+from transformers import AutoModelForCausalLM
+model = AutoModelForCausalLM.from_pretrained("PatronusAI/glider-gguf", gguf_file="glider_Q8_0.gguf")
+```
+For any issues or questions, reach out to [Darshan Deshpande](https://huggingface.co/darshandeshpande) or [Rebecca Qian](https://huggingface.co/RebeccaQian1)

glider_Q8_0.gguf ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:efddf1a35a4d54169f0022553577b83e6d0e5982b11c24cda71098431c7df610
+size 4061222560