Masajoe
/

llm-jp-3-13b-it_lora

Model card Files Files and versions

Masajoe commited on Nov 27, 2024

Commit

6cb25e5

·

verified ·

1 Parent(s): 2fff078

Update README.md

Files changed (1) hide show

README.md +36 -11

README.md CHANGED Viewed

@@ -1,14 +1,39 @@
----
-base_model: llm-jp/llm-jp-3-13b
-tags:
-- text-generation-inference
-- transformers
-- unsloth
-- llama
-- trl
-license: apache-2.0
-language:
-- en
 ---
 # Uploaded  model

+# llm-jp-3-13b-it_lora
+このモデルは llm-jp/llm-jp-3-13b をベースに、教師あり学習（SFT）で事後学習を行ったモデルです。
+## モデルの詳細
+- ベースモデル: llm-jp/llm-jp-3-13b
+- 学習手法: LoRA (Low-Rank Adaptation)
+- 量子化: 4bit量子化
+## 使用方法
+以下のコードで推論が可能です：
+```python
+from transformers import AutoModelForCausalLM, AutoTokenizer
+# モデルとトークナイザーのロード
+model_name = "Masajoe/llm-jp-3-13b-it_lora"
+tokenizer = AutoTokenizer.from_pretrained(model_name)
+model = AutoModelForCausalLM.from_pretrained(model_name)
+# 推論
+prompt = """### 指示
+仕事の熱意を取り戻すためのアイデアを教えてください。
+### 回答
+"""
+inputs = tokenizer([prompt], return_tensors="pt").to(model.device)
+outputs = model.generate(
+    **inputs,
+    max_new_tokens=512,
+    do_sample=False,
+    repetition_penalty=1.2
+)
+print(tokenizer.decode(outputs[0], skip_special_tokens=True))
 ---
 # Uploaded  model