sh2orc commited on
Commit
53f7012
·
verified ·
1 Parent(s): 7ff33cc

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +64 -4
README.md CHANGED
@@ -6,15 +6,18 @@ license: llama3
6
  - datasets
7
  - [jojo0217/korean_safe_conversation](https://huggingface.co/datasets/jojo0217/korean_safe_conversation)
8
 
9
- # Query
10
  ```python
11
 
12
  import torch
13
  from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
14
 
15
- BASE_MODEL = "sh2orc/llama-3-korean-8b"
16
 
17
- model = AutoModelForCausalLM.from_pretrained(BASE_MODEL,device_map="auto")
 
 
 
18
 
19
  tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL)
20
  tokenizer.pad_token = tokenizer.eos_token
@@ -51,11 +54,68 @@ outputs = pipe(
51
  )
52
 
53
  print(outputs[0]['generated_text'][len(prompt):])
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
54
  ```
55
 
 
56
  # Result
57
  <pre>
58
 
59
- 할부 결제란 대출금을 일정 기간 동안 나눠서 상환하는 것입니다. 예를 들어, 100만원을 대출받고 10만원씩 10번 걸쳐서 상환할 있습니다. 이때, 번째 상환 시에 10만원을 지불하면 90만원이 남습니다. 그리고 번째 상환 시에 10달러를 지불하면 80만원이 남게 됩니다. 이런 식으로 10만원씩면서 10번 지불하면 대출금 전액을 지불하게 됩니다.
60
 
61
  </pre>
 
 
6
  - datasets
7
  - [jojo0217/korean_safe_conversation](https://huggingface.co/datasets/jojo0217/korean_safe_conversation)
8
 
9
+ # Usage for Transformers
10
  ```python
11
 
12
  import torch
13
  from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
14
 
15
+ BASE_MODEL = "./llama-3-korean-8b"
16
 
17
+ model = AutoModelForCausalLM.from_pretrained(BASE_MODEL,
18
+ torch_dtype=torch.bfloat16,
19
+ attn_implementation="flash_attention_2",
20
+ device_map="cuda:0")
21
 
22
  tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL)
23
  tokenizer.pad_token = tokenizer.eos_token
 
54
  )
55
 
56
  print(outputs[0]['generated_text'][len(prompt):])
57
+ print(outputs[0]['generated_text'][len(prompt):])
58
+ ```
59
+
60
+ # Result
61
+ <pre>
62
+
63
+ 할부 요금은 물건을 살 때, 그 값을 일정 기간 동안 나눠서 지불하는 방식입니다. 예를 들어, 50만원짜리 제품을 10개월 할부로 구매한다면, 각 달마다 5만원씩 10개월이 동안 지불하게 됩니다. 이때, 할부 요금은 일정 기간 동안 이자 없이 물건을 사용할 수 있는 이점이 있지만, 동시에 연체료가 부과될 수 있으며, 채무가 발생하게 됩니다. 따라서, 할부를 사용할 때는 자신의 재정 상태와 구매할 물건을 잘 고려해야 합니다.
64
+
65
+ </pre>
66
+
67
+
68
+
69
+
70
+ # Usage for VLLM
71
+ ```python
72
+ from vllm import LLM, SamplingParams
73
+ from transformers import AutoTokenizer, pipeline
74
+
75
+ BASE_MODEL = "sh2orc/llama-3-korean-8b-awq"
76
+
77
+ llm = LLM(model=BASE_MODEL)
78
+
79
+ tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL)
80
+ tokenizer.pad_token = tokenizer.eos_token
81
+ tokenizer.padding_side = 'right'
82
+
83
+ instruction = '카드 할부 결제에 대해서 알려줘'
84
+
85
+ messages = [
86
+ {
87
+ "role": "system",
88
+ "content": "당신은 훌륭한 AI 비서입니다. You are a great AI assistant."
89
+ },
90
+ {
91
+ "role": "user",
92
+ "content": instruction
93
+ },
94
+ ]
95
+
96
+
97
+ prompt_message = tokenizer.apply_chat_template(
98
+ messages,
99
+ tokenize=False,
100
+ add_generation_prompt=True,
101
+ )
102
+
103
+ eos_token_id = [tokenizer.eos_token_id, tokenizer.convert_tokens_to_ids("<|eot_id|>")]
104
+
105
+ outputs = llm.generate(prompt_message, SamplingParams(stop_token_ids=eos_token_id, temperature=0.6, top_p=0.8,max_tokens=4096))
106
+
107
+ for output in outputs:
108
+ propt = output.prompt
109
+ generated_text = output.outputs[0].text
110
+ print(generated_text)
111
+
112
  ```
113
 
114
+
115
  # Result
116
  <pre>
117
 
118
+ 카드 할부 결제는 결제할 금액을 일정 기간 동안 나눠서 갚는 방식으로, 카드사에 의해 대출된 금액을 갚는 것입니다. 카드 할부 결제는 일정한 기간 동안 상환할 있는 금액을 선택하여 결제할 있으며, 과정에서 이자를 지불해야 합니다. 카드 할부 결제는 일시불 결제보다 유리할 있지만, 이자를 지불해야 하기 때문에 비용이 증가합니다.
119
 
120
  </pre>
121
+