second-state
/

Yi-34Bx2-MoE-60B-GGUF

@@ -48,13 +48,22 @@ tags:
 - Run as LlamaEdge service
   ```bash
-  wasmedge --dir .:. --nn-preload default:GGML:AUTO:Yi-34Bx2-MoE-60B-Q5_K_M.gguf llama-api-server.wasm -p chatml -r '<|im_end|>'
   ```
 - Run as LlamaEdge command app
   ```bash
-  wasmedge --dir .:. --nn-preload default:GGML:AUTO:Yi-34Bx2-MoE-60B-Q5_K_M.gguf llama-chat.wasm -p chatml -r '<|im_end|>'
   ```
 ## Quantized GGUF Models
@@ -72,3 +81,16 @@ tags:
 | [Yi-34Bx2-MoE-60B-Q5_K_M.gguf](https://huggingface.co/second-state/Yi-34Bx2-MoE-60B-GGUF/blob/main/Yi-34Bx2-MoE-60B-Q5_K_M.gguf) | Q5_K_M | 5 | 43.1 GB| large, very low quality loss - recommended |
 | [Yi-34Bx2-MoE-60B-Q5_K_S.gguf](https://huggingface.co/second-state/Yi-34Bx2-MoE-60B-GGUF/blob/main/Yi-34Bx2-MoE-60B-Q5_K_S.gguf) | Q5_K_S | 5 | 41.9 GB| large, low quality loss - recommended |
 | [Yi-34Bx2-MoE-60B-Q6_K.gguf](https://huggingface.co/second-state/Yi-34Bx2-MoE-60B-GGUF/blob/main/Yi-34Bx2-MoE-60B-Q6_K.gguf)     | Q6_K   | 6 | 49.9 GB| very large, extremely low quality loss |

 - Run as LlamaEdge service
   ```bash
+  wasmedge --dir .:. --nn-preload default:GGML:AUTO:Yi-34Bx2-MoE-60B-Q5_K_M.gguf \
+    llama-api-server.wasm \
+    --prompt-template chatml \
+    --reverse-prompt '<|im_end|>' \
+    --ctx-size 7168 \
+    --model-name Yi-34Bx2-MoE-60B
   ```
 - Run as LlamaEdge command app
   ```bash
+  wasmedge --dir .:. --nn-preload default:GGML:AUTO:Yi-34Bx2-MoE-60B-Q5_K_M.gguf \
+    llama-chat.wasm \
+    --prompt-template chatml \
+    --reverse-prompt '<|im_end|>' \
+    --ctx-size 7168
   ```
 ## Quantized GGUF Models
 | [Yi-34Bx2-MoE-60B-Q5_K_M.gguf](https://huggingface.co/second-state/Yi-34Bx2-MoE-60B-GGUF/blob/main/Yi-34Bx2-MoE-60B-Q5_K_M.gguf) | Q5_K_M | 5 | 43.1 GB| large, very low quality loss - recommended |
 | [Yi-34Bx2-MoE-60B-Q5_K_S.gguf](https://huggingface.co/second-state/Yi-34Bx2-MoE-60B-GGUF/blob/main/Yi-34Bx2-MoE-60B-Q5_K_S.gguf) | Q5_K_S | 5 | 41.9 GB| large, low quality loss - recommended |
 | [Yi-34Bx2-MoE-60B-Q6_K.gguf](https://huggingface.co/second-state/Yi-34Bx2-MoE-60B-GGUF/blob/main/Yi-34Bx2-MoE-60B-Q6_K.gguf)     | Q6_K   | 6 | 49.9 GB| very large, extremely low quality loss |
+| [Yi-34Bx2-MoE-60B-Q8_0-00001-of-00003.gguf](https://huggingface.co/second-state/Yi-34Bx2-MoE-60B-GGUF/blob/main/Yi-34Bx2-MoE-60B-Q8_0-00001-of-00003.gguf)     | Q8_0   | 8 | 32.2 GB| very large, extremely low quality loss - not recommended |
+| [Yi-34Bx2-MoE-60B-Q8_0-00002-of-00003.gguf](https://huggingface.co/second-state/Yi-34Bx2-MoE-60B-GGUF/blob/main/Yi-34Bx2-MoE-60B-Q8_0-00002-of-00003.gguf)     | Q8_0   | 8 | 32.1 GB| very large, extremely low quality loss - not recommended |
+| [Yi-34Bx2-MoE-60B-Q8_0-00001-of-00003.gguf](https://huggingface.co/second-state/Yi-34Bx2-MoE-60B-GGUF/blob/main/Yi-34Bx2-MoE-60B-Q8_0-00003-of-00003.gguf)     | Q8_0   | 8 | 312 MB| very large, extremely low quality loss - not recommended |
+| [Yi-34Bx2-MoE-60B-f16-00001-of-00008.gguf](https://huggingface.co/second-state/Yi-34Bx2-MoE-60B-GGUF/blob/main/Yi-34Bx2-MoE-60B-f16-00001-of-00008.gguf)     | f16   | 16 | 31.9 GB|  |
+| [Yi-34Bx2-MoE-60B-f16-00002-of-00008.gguf](https://huggingface.co/second-state/Yi-34Bx2-MoE-60B-GGUF/blob/main/Yi-34Bx2-MoE-60B-f16-00002-of-00008.gguf)     | f16   | 16 | 31.7 GB|  |
+| [Yi-34Bx2-MoE-60B-f16-00003-of-00008.gguf](https://huggingface.co/second-state/Yi-34Bx2-MoE-60B-GGUF/blob/main/Yi-34Bx2-MoE-60B-f16-00003-of-00008.gguf)     | f16   | 16 | 31.7 GB|  |
+| [Yi-34Bx2-MoE-60B-f16-00004-of-00008.gguf](https://huggingface.co/second-state/Yi-34Bx2-MoE-60B-GGUF/blob/main/Yi-34Bx2-MoE-60B-f16-00004-of-00008.gguf)     | f16   | 16 | 31.7 GB|  |
+| [Yi-34Bx2-MoE-60B-f16-00005-of-00008.gguf](https://huggingface.co/second-state/Yi-34Bx2-MoE-60B-GGUF/blob/main/Yi-34Bx2-MoE-60B-f16-00005-of-00008.gguf)     | f16   | 16 | 31.7 GB|  |
+| [Yi-34Bx2-MoE-60B-f16-00006-of-00008.gguf](https://huggingface.co/second-state/Yi-34Bx2-MoE-60B-GGUF/blob/main/Yi-34Bx2-MoE-60B-f16-00006-of-00008.gguf)     | f16   | 16 | 31.7 GB|  |
+| [Yi-34Bx2-MoE-60B-f16-00007-of-00008.gguf](https://huggingface.co/second-state/Yi-34Bx2-MoE-60B-GGUF/blob/main/Yi-34Bx2-MoE-60B-f16-00007-of-00008.gguf)     | f16   | 16 | 31.7 GB|  |
+| [Yi-34Bx2-MoE-60B-f16-00008-of-00008.gguf](https://huggingface.co/second-state/Yi-34Bx2-MoE-60B-GGUF/blob/main/Yi-34Bx2-MoE-60B-f16-00008-of-00008.gguf)     | f16   | 16 | 21.1 GB|  |
+*Quantized with llama.cpp b2734*