kromcomp
/

L3.1-Mistral-Data-r128-LoRA

Model card Files Files and versions Community

Mistral-Data-r128-LoRA

This is a LoRA extracted from a language model. It was extracted using mergekit.

LoRA Details

This LoRA adapter was extracted from RLHFlow/Llama3.1-8B-PRM-Mistral-Data and uses unsloth/Meta-Llama-3.1-8B-Instruct as a base.

Parameters

The following command was used to extract this LoRA adapter:

mergekit-extract-lora RLHFlow/Llama3.1-8B-PRM-Mistral-Data unsloth/Meta-Llama-3.1-8B-Instruct OUTPUT_PATH --no-lazy-unpickle --skip-undecomposable --rank=128 --extend-vocab --model_name=Mistral-Data-r128-LoRA --verbose

Downloads last month: -; Downloads are not tracked for this model. How to track

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for kromcomp/L3.1-Mistral-Data-r128-LoRA

Base model

RLHFlow/Llama3.1-8B-PRM-Mistral-Data

Finetuned

(1)

this model