student-abdullah
/

Quantized_Qwen-2.5-Coding-0.5B_mixed_selective

text-generation-inference

Model card Files Files and versions Community

student-abdullah commited on 21 days ago

Commit

8504523

·

verified ·

1 Parent(s): 6ea82ab

Update README.md

Files changed (1) hide show

README.md +1 -27

README.md CHANGED Viewed

@@ -54,33 +54,7 @@ Rest of the remaining layers were quantized to *q3_k_l*
 ---
 # Model Architect
-Qwen2ForCausalLM(
-  (model): Qwen2Model(
-    (embed_tokens): Embedding(151936, 896, padding_idx=151665)
-    (layers): ModuleList(
-      (0-23): 24 x Qwen2DecoderLayer(
-        (self_attn): Qwen2Attention(
-          (q_proj): Linear(in_features=896, out_features=896, bias=True)
-          (k_proj): Linear(in_features=896, out_features=128, bias=True)
-          (v_proj): Linear(in_features=896, out_features=128, bias=True)
-          (o_proj): Linear(in_features=896, out_features=896, bias=False)
-          (rotary_emb): LlamaRotaryEmbedding()
-        )
-        (mlp): Qwen2MLP(
-          (gate_proj): Linear(in_features=896, out_features=4864, bias=False)
-          (up_proj): Linear(in_features=896, out_features=4864, bias=False)
-          (down_proj): Linear(in_features=4864, out_features=896, bias=False)
-          (act_fn): SiLU()
-        )
-        (input_layernorm): Qwen2RMSNorm((896,), eps=1e-06)
-        (post_attention_layernorm): Qwen2RMSNorm((896,), eps=1e-06)
-      )
-    )
-    (norm): Qwen2RMSNorm((896,), eps=1e-06)
-    (rotary_emb): LlamaRotaryEmbedding()
-  )
-  (lm_head): Linear(in_features=896, out_features=151936, bias=False)
-)
 ---
 # Performance & Limitations

 ---
 # Model Architect
+<pre><code>```python Qwen2ForCausalLM( (model): Qwen2Model( (embed_tokens): Embedding(151936, 896, padding_idx=151665) (layers): ModuleList( (0-23): 24 x Qwen2DecoderLayer( (self_attn): Qwen2Attention( (q_proj): Linear(in_features=896, out_features=896, bias=True) (k_proj): Linear(in_features=896, out_features=128, bias=True) (v_proj): Linear(in_features=896, out_features=128, bias=True) (o_proj): Linear(in_features=896, out_features=896, bias=False) (rotary_emb): LlamaRotaryEmbedding() ) (mlp): Qwen2MLP( (gate_proj): Linear(in_features=896, out_features=4864, bias=False) (up_proj): Linear(in_features=896, out_features=4864, bias=False) (down_proj): Linear(in_features=4864, out_features=896, bias=False) (act_fn): SiLU() ) (input_layernorm): Qwen2RMSNorm((896,), eps=1e-06) (post_attention_layernorm): Qwen2RMSNorm((896,), eps=1e-06) ) ) (norm): Qwen2RMSNorm((896,), eps=1e-06) (rotary_emb): LlamaRotaryEmbedding() ) (lm_head): Linear(in_features=896, out_features=151936, bias=False) ) ```</code></pre>
 ---
 # Performance & Limitations