TinyLlama_v1.1_1bit_BitDistiller

This is a 1-bit quantized version of TinyLlama v1.1, trained using BitDistiller with asymmetric quantization and self-distillation (CAKLD) to optimize accuracy retention under extreme compression. The model is fine-tuned on WikiText-2 and Alpaca-cleaned datasets and evaluated on multiple-choice QA benchmarks.

Key Features:

1-bit quantization for ultra-efficient inference.
Asymmetric weight clipping to reduce precision loss.
CAKLD knowledge distillation to preserve performance.
Tested on ARC-Challenge, HellaSwag, PIQA, and Winogrande.

Downloads last month: 27

Safetensors

Model size

1.1B params

Tensor type

BF16

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for fredericowieser/TinyLlama_v1.1_mix_wikitext_alpaca_1bit_BitDistiller_baseline

Base model

TinyLlama/TinyLlama_v1.1

Finetuned

(35)

this model

Datasets used to train fredericowieser/TinyLlama_v1.1_mix_wikitext_alpaca_1bit_BitDistiller_baseline

Evaluation results

Accuracy on ARC-Challenge
test set self-reported

0.215
Normalized Accuracy on ARC-Challenge
test set self-reported

0.247
Accuracy on HellaSwag
test set self-reported

0.257
Normalized Accuracy on HellaSwag
test set self-reported

0.253
Accuracy on PIQA
validation set self-reported

0.528
Normalized Accuracy on PIQA
validation set self-reported

0.503
Accuracy on Winogrande
test set self-reported

0.512
QA Average on QA-Avg
self-reported

0.378

View on Papers With Code