asaoka commited on
Commit
0f9d579
·
verified ·
1 Parent(s): 706304d

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +24 -11
README.md CHANGED
@@ -6,9 +6,11 @@ tags:
6
 
7
  # モデル概要
8
 
9
- Llama2-7Bを日本語データ([taka-yayoi/databricks-dolly-15k-ja](https://huggingface.co/datasets/taka-yayoi/databricks-dolly-15k-ja))を用いてインストラクションチューニングしました.
 
 
 
10
 
11
- # 使用方法
12
 
13
  # トレーニング方法
14
 
@@ -16,19 +18,30 @@ Llama2-7Bを日本語データ([taka-yayoi/databricks-dolly-15k-ja](https://hu
16
 
17
  # JGLUEスコア
18
 
19
- | タスク | スコア |
20
  |:-|:-|
21
- | jcommonsenseqa-1.1-0.6(acc) | 0.2672 |
22
 
23
  [JGLUEスコア](https://aclanthology.org/2022.lrec-1.317/)は,Stability AI社の[lm-evaluation-harness](https://github.com/Stability-AI/lm-evaluation-harness)を用いて
24
  算出しました.JGLUEスコアの算出に用いたスクリプトを下記に示します.
25
 
26
  ```bash
27
- python main.py \
28
- --model hf-causal-experimental \
29
- --model_args "pretrained=asaoka/japanese-mistral-300m-clone" \
30
- --tasks jsquad-1.2-0.6,jcommonsenseqa-1.1-0.6,jnli-1.3-0.6,marc_ja-1.1-0.6 \
31
- --num_fewshot 2,3,3,3 \
32
- --device cuda \
33
- --output_path "./results.json"
 
 
 
 
 
 
 
 
 
 
34
  ```
 
 
6
 
7
  # モデル概要
8
 
9
+ [meta-llama/Llama-2-7b-hf](https://huggingface.co/meta-llama/Llama-2-7b-hf)を日本語データ([taka-yayoi/databricks-dolly-15k-ja](https://huggingface.co/datasets/taka-yayoi/databricks-dolly-15k-ja))を用いてインストラクションチューニングしました.
10
+
11
+ # 使用方法
12
+
13
 
 
14
 
15
  # トレーニング方法
16
 
 
18
 
19
  # JGLUEスコア
20
 
21
+ | タスク | Llama-2-7b-hf | This Model |
22
  |:-|:-|
23
+ | jcommonsenseqa-1.1-0.6(acc) | 0.7274 | ? |
24
 
25
  [JGLUEスコア](https://aclanthology.org/2022.lrec-1.317/)は,Stability AI社の[lm-evaluation-harness](https://github.com/Stability-AI/lm-evaluation-harness)を用いて
26
  算出しました.JGLUEスコアの算出に用いたスクリプトを下記に示します.
27
 
28
  ```bash
29
+ !python main.py \
30
+ --model hf-causal-experimental \
31
+ --model_args pretrained=meta-llama/Llama-2-7b-hf \
32
+ --tasks jcommonsenseqa-1.1-0.6 \
33
+ --num_fewshot 3 \
34
+ --device cuda \
35
+ --output_path ./results.json
36
+ ```
37
+
38
+ ```bash
39
+ !python main.py \
40
+ --model hf-causal-experimental \
41
+ --model_args pretrained=meta-llama/Llama-2-7b-hf,peft=asaoka/Llama-2-7b-hf-qlora-dolly15k-japanese \
42
+ --tasks jcommonsenseqa-1.1-0.6 \
43
+ --num_fewshot 3 \
44
+ --device cuda \
45
+ --output_path ./results.json
46
  ```
47
+