Update models

Files changed (15) hide show

.gitattributes CHANGED Viewed

@@ -33,3 +33,16 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+Llama-3.2-3B-Instruct-Q2_K.gguf filter=lfs diff=lfs merge=lfs -text
+Llama-3.2-3B-Instruct-Q3_K_L.gguf filter=lfs diff=lfs merge=lfs -text
+Llama-3.2-3B-Instruct-Q3_K_M.gguf filter=lfs diff=lfs merge=lfs -text
+Llama-3.2-3B-Instruct-Q3_K_S.gguf filter=lfs diff=lfs merge=lfs -text
+Llama-3.2-3B-Instruct-Q4_0.gguf filter=lfs diff=lfs merge=lfs -text
+Llama-3.2-3B-Instruct-Q4_K_M.gguf filter=lfs diff=lfs merge=lfs -text
+Llama-3.2-3B-Instruct-Q4_K_S.gguf filter=lfs diff=lfs merge=lfs -text
+Llama-3.2-3B-Instruct-Q5_0.gguf filter=lfs diff=lfs merge=lfs -text
+Llama-3.2-3B-Instruct-Q5_K_M.gguf filter=lfs diff=lfs merge=lfs -text
+Llama-3.2-3B-Instruct-Q5_K_S.gguf filter=lfs diff=lfs merge=lfs -text
+Llama-3.2-3B-Instruct-Q6_K.gguf filter=lfs diff=lfs merge=lfs -text
+Llama-3.2-3B-Instruct-Q8_0.gguf filter=lfs diff=lfs merge=lfs -text
+Llama-3.2-3B-Instruct-f16.gguf filter=lfs diff=lfs merge=lfs -text

Llama-3.2-3B-Instruct-Q2_K.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:f355e9b1a6c69ee7ea297f8b3bb38c44ab00ad7bc9f699babe0a02eae61cf276
+size 1363935520

Llama-3.2-3B-Instruct-Q3_K_L.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:f778dda3fa1dd1c34747038221113b7940b3b26645e50775bbc8b4a8997040c6
+size 1815347488

Llama-3.2-3B-Instruct-Q3_K_M.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:21c7b1e2c11ce80e0de67c3b6aeace40edf6cd0c6606d3c0085117b9c8951669
+size 1687159072

Llama-3.2-3B-Instruct-Q3_K_S.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:24f06a24cf262e93c9c25dea3f207593e23293df4732a49cdc887bbf3d145e14
+size 1542848800

Llama-3.2-3B-Instruct-Q4_0.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:aec4181a9debbcd9213f4c8e6b4b33bd24181feb373332d904839492a8b4169b
+size 1917190432

Llama-3.2-3B-Instruct-Q4_K_M.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:e4f1a04d927b09ec18eb2f233d85ecd760fc2d35cec97e37f8604d3632210d9a
+size 2019377440

Llama-3.2-3B-Instruct-Q4_K_S.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:5f3e5cc3cb1d83b9b9b2876250db8703d93eb23803598eafd3aafe5b5da99d1f
+size 1928200480

Llama-3.2-3B-Instruct-Q5_0.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:c112217953cbe9e97e03ac9e459d1629cf939ccaf669bde8250901cf2277ef4c
+size 2269511968

Llama-3.2-3B-Instruct-Q5_K_M.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:5fcbaeaa8e8cd835fd38f2d1daccd58816ba79af262d2335b7454cf0bd21d7cf
+size 2322153760

Llama-3.2-3B-Instruct-Q5_K_S.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:a47518afcfee91bf0b4a6da63ad87774b9dc403a643f3450fb1761fd5a03b59d
+size 2269511968

Llama-3.2-3B-Instruct-Q6_K.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:2ccc943ca31e72526a309b319b15d1ec453cd1c01e27aea4731ccc6a3bfab264
+size 2643853600

Llama-3.2-3B-Instruct-Q8_0.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:94f22b7231df5cd1907ff48dba54497b2d7912a4ce60d914f3dcfc0347fa8f21
+size 3421899040

Llama-3.2-3B-Instruct-f16.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:b5ebe8fbb5ab5f05aaa056948668c5f7443df9d0883497f1d9c05f57fb8ea6cd
+size 6433687840

config.json ADDED Viewed

+{
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "bos_token_id": 128000,
+  "eos_token_id": [
+    128001,
+    128008,
+    128009
+  ],
+  "head_dim": 128,
+  "hidden_act": "silu",
+  "hidden_size": 3072,
+  "initializer_range": 0.02,
+  "intermediate_size": 8192,
+  "max_position_embeddings": 131072,
+  "mlp_bias": false,
+  "model_type": "llama",
+  "num_attention_heads": 24,
+  "num_hidden_layers": 28,
+  "num_key_value_heads": 8,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": {
+    "factor": 32.0,
+    "high_freq_factor": 4.0,
+    "low_freq_factor": 1.0,
+    "original_max_position_embeddings": 8192,
+    "rope_type": "llama3"
+  },
+  "rope_theta": 500000.0,
+  "tie_word_embeddings": true,
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.45.0.dev0",
+  "use_cache": true,
+  "vocab_size": 128256
+}