--- base_model: llm-jp/llm-jp-3-13b tags: - text-generation-inference - transformers - unsloth - llama - trl license: apache-2.0 language: - en --- # Uploaded model - **Developed by:** fuwafuwa012 - **License:** apache-2.0 - **Finetuned from model :** llm-jp/llm-jp-3-13b This llama model was trained 2x faster with [Unsloth](https://github.com/unslothai/unsloth) and Huggingface's TRL library. [

](https://github.com/unslothai/unsloth) code version 2 本コードは，elyza-tasks-100-TV_0.jsonlの回答のための推論用コードです。 unslothのサンプルコードのハイパーパラメーターの値を変更して学習させたモデルになっています。変更点としては，以下の通りです。 lora_alphaの値を64として正規化項を増やす。 lora_dropoutを0.10としてdropoutを上昇させる。学習率を1e-5と上昇。出力に対して，do_sample=True と temperature や top_p を加えることで出力の多様性を向上。