Felladrin
/

TinyMistral-248M-Chat-v2

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Felladrin commited on Dec 11, 2023

Commit

a2f772f

·

1 Parent(s): 144dc13

Update README.md

Files changed (1) hide show

README.md +3 -35

README.md CHANGED Viewed

@@ -22,15 +22,14 @@ widget:
 inference:
   parameters:
     max_new_tokens: 64
-    repetition_penalty: 1.18
 ---
 # Locutusque's TinyMistral-248M trained on OpenAssistant TOP-1 Conversation Threads
-- Base model: [Locutusque/TinyMistral-248M](https://huggingface.co/Locutusque/TinyMistral-248M/blob/90b89d18fdf27937dc04ab8a9b543c5af2991c7f/README.md)
 - Dataset: [OpenAssistant/oasst_top1_2023-08-25](https://huggingface.co/datasets/OpenAssistant/oasst_top1_2023-08-25)
-- Availability in other ML formats:
-  - GGUF: [afrideva/TinyMistral-248M-SFT-v3-GGUF](https://huggingface.co/afrideva/TinyMistral-248M-SFT-v3-GGUF)
 ## Recommended Prompt Format
@@ -39,34 +38,3 @@ inference:
 {message}<|im_end|>
 <|im_start|>assistant
 ```
-## How it was trained
-```ipython
-%pip install autotrain-advanced
-!autotrain setup
-!autotrain llm \
-    --train \
-    --trainer "sft" \
-    --model './TinyMistral-248M/' \
-    --model_max_length 4096 \
-    --block-size 1024 \
-    --project-name 'trained-model' \
-    --data-path "OpenAssistant/oasst_top1_2023-08-25" \
-    --train_split "train" \
-    --valid_split "test" \
-    --text-column "text" \
-    --lr 1e-5 \
-    --train_batch_size 2 \
-    --epochs 5 \
-    --evaluation_strategy "steps" \
-    --save-strategy "steps" \
-    --save-total-limit 2 \
-    --warmup-ratio 0.05 \
-    --weight-decay 0.0 \
-    --gradient-accumulation 8 \
-    --logging-steps 10 \
-    --scheduler "constant"
-```

 inference:
   parameters:
     max_new_tokens: 64
+    penalty_alpha: 0.5
+    top_k: 12
 ---
 # Locutusque's TinyMistral-248M trained on OpenAssistant TOP-1 Conversation Threads
+- Base model: [Locutusque/TinyMistral-248M](https://huggingface.co/Locutusque/TinyMistral-248M)
 - Dataset: [OpenAssistant/oasst_top1_2023-08-25](https://huggingface.co/datasets/OpenAssistant/oasst_top1_2023-08-25)
 ## Recommended Prompt Format
 {message}<|im_end|>
 <|im_start|>assistant
 ```