athirdpath
/

Llama-3-11b-Instruct

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

athirdpath commited on May 2

Commit

843173f

•

1 Parent(s): 2745306

Update README.md

Files changed (1) hide show

README.md +78 -29

README.md CHANGED Viewed

@@ -1,39 +1,88 @@
 ---
-base_model: []
-library_name: transformers
-tags:
-- mergekit
-- merge
 ---
-# wibblestock
-This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).
-## Merge Details
-### Merge Method
-This model was merged using the [Model Stock](https://arxiv.org/abs/2403.19522) merge method using ./wibblel3 as a base.
-### Models Merged
-The following models were included in the merge:
-* ./bigl3_2
-* ./bigl3
-### Configuration
-The following YAML configuration was used to produce this model:
-```yaml
-models:
-  - model: ./wibblel3
-  - model: ./bigl3
-  - model: ./bigl3_2
-merge_method: model_stock
-base_model: ./wibblel3
-parameters:
-  normalize: true
-  int8_mask: true
-dtype: float16
-```

 ---
+license: llama3
 ---
+This is a merge stock of 3 models:
+ - Part Wave
+ - Part Block
+ - Part Funnel
+With Part Funnel as the base.
+---
+Part Wave:
+  - sources:
+      - model: NousResearch/Meta-Llama-3-8B-Instruct
+        layer_range: [0, 12]
+  - sources:
+      - model: NousResearch/Meta-Llama-3-8B-Instruct
+        layer_range: [8, 18]
+  - sources:
+      - model: NousResearch/Meta-Llama-3-8B-Instruct
+        layer_range: [13, 23]
+  - sources:
+      - model: NousResearch/Meta-Llama-3-8B-Instruct
+        layer_range: [18, 32]
+---
+Part Block:
+  - sources:
+      - model: NousResearch/Meta-Llama-3-8B-Instruct
+        layer_range: [0, 15]
+  - sources:
+      - model: NousResearch/Meta-Llama-3-8B-Instruct
+        layer_range: [8, 23]
+  - sources:
+      - model: NousResearch/Meta-Llama-3-8B-Instruct
+        layer_range: [16, 32]
+---
+Part Funnel:
+  - sources:
+      - model: NousResearch/Meta-Llama-3-8B-Instruct
+        layer_range: [0, 15]
+  - sources:
+      - model: NousResearch/Meta-Llama-3-8B-Instruct
+        layer_range: [14, 14]
+  - sources:
+      - model: NousResearch/Meta-Llama-3-8B-Instruct
+        layer_range: [13, 13]
+  - sources:
+      - model: NousResearch/Meta-Llama-3-8B-Instruct
+        layer_range: [12, 12]
+  - sources:
+      - model: NousResearch/Meta-Llama-3-8B-Instruct
+        layer_range: [11, 11]
+  - sources:
+      - model: NousResearch/Meta-Llama-3-8B-Instruct
+        layer_range: [10, 10]
+  - sources:
+      - model: NousResearch/Meta-Llama-3-8B-Instruct
+        layer_range: [9, 9]
+  - sources:
+      - model: NousResearch/Meta-Llama-3-8B-Instruct
+        layer_range: [8, 23]
+  - sources:
+      - model: NousResearch/Meta-Llama-3-8B-Instruct
+        layer_range: [22, 22]
+  - sources:
+      - model: NousResearch/Meta-Llama-3-8B-Instruct
+        layer_range: [21, 21]
+  - sources:
+      - model: NousResearch/Meta-Llama-3-8B-Instruct
+        layer_range: [20, 20]
+  - sources:
+      - model: NousResearch/Meta-Llama-3-8B-Instruct
+        layer_range: [19, 19]
+  - sources:
+      - model: NousResearch/Meta-Llama-3-8B-Instruct
+        layer_range: [18, 18]
+  - sources:
+      - model: NousResearch/Meta-Llama-3-8B-Instruct
+        layer_range: [17, 17]
+  - sources:
+      - model: NousResearch/Meta-Llama-3-8B-Instruct
+        layer_range: [16, 32]