sh2orc
/

Llama-3-Korean-8B

@@ -1,62 +1,61 @@
----
-license: llama3
----
-- Foundation Model [Bllossom 8B](https://huggingface.co/MLP-KTLim/llama-3-Korean-Bllossom-8B)
-- datasets
-  -  [Koalpaca v1.1a](https://huggingface.co/datasets/beomi/KoAlpaca-v1.1a)
-  -  [jojo0217/korean_safe_conversation](https://huggingface.co/datasets/jojo0217/korean_safe_conversation)
-# Query
-```python
-import torch
-from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
-BASE_MODEL = "sh2orc/llama-3-korean-8b"
-model = AutoModelForCausalLM.from_pretrained(BASE_MODEL,device_map="auto")
-tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL)
-tokenizer.pad_token = tokenizer.eos_token
-tokenizer.padding_side = 'right'
-instruction = "한강에는 대교가 몇 개 있어?"
-pipe = pipeline("text-generation",
-                model=model,
-                tokenizer=tokenizer,
-                max_new_tokens=1024)
-messages = [
-    {"role": "user", "content": instruction},
-]
-prompt = pipe.tokenizer.apply_chat_template(
-        messages,
-        tokenize=False,
-        add_generation_prompt=True
-)
-outputs = pipe(
-    prompt,
-    do_sample=True,
-    temperature=0.8,
-    top_k=10,
-    top_p=0.9,
-    add_special_tokens=True,
-    eos_token_id = [
-        pipe.tokenizer.eos_token_id,
-        pipe.tokenizer.convert_tokens_to_ids("<|eot_id|>")
-    ]
-)
-print(outputs[0]['generated_text'][len(prompt):])
-```
-# Result
-<pre>
-한강에는 총 8개의 다리(교)가 있습니다. 그 중 3개는 북쪽으로 향해 있고, 나머지 5개는 남쪽으로 향해 있습니다.
-</pre>

+---
+license: llama3
+---
+- Foundation Model [Bllossom 8B](https://huggingface.co/MLP-KTLim/llama-3-Korean-Bllossom-8B)
+- datasets
+  -  [jojo0217/korean_safe_conversation](https://huggingface.co/datasets/jojo0217/korean_safe_conversation)
+# Query
+```python
+import torch
+from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
+BASE_MODEL = "sh2orc/llama-3-korean-8b"
+model = AutoModelForCausalLM.from_pretrained(BASE_MODEL,device_map="auto")
+tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL)
+tokenizer.pad_token = tokenizer.eos_token
+tokenizer.padding_side = 'right'
+instruction = '할부 결제 대해서 설명해줘'
+pipe = pipeline("text-generation",
+                model=model,
+                tokenizer=tokenizer,
+                max_new_tokens=1024)
+messages = [
+    {"role": "user", "content": instruction},
+]
+prompt = pipe.tokenizer.apply_chat_template(
+        messages,
+        tokenize=False,
+        add_generation_prompt=True
+)
+outputs = pipe(
+    prompt,
+    do_sample=True,
+    temperature=0.8,
+    top_k=10,
+    top_p=0.9,
+    add_special_tokens=True,
+    eos_token_id = [
+        pipe.tokenizer.eos_token_id,
+        pipe.tokenizer.convert_tokens_to_ids("<|eot_id|>")
+    ]
+)
+print(outputs[0]['generated_text'][len(prompt):])
+```
+# Result
+<pre>
+할부 결제란 대출금을 일정 기간 동안 나눠서 상환하는 것입니다. 예를 들어, 100만원을 대출받고 10만원씩 10번 걸쳐서 상환할 수 있습니다. 이때, 첫 번째 상환 시에 10만원을 지불하면 90만원이 남습니다. 그리고 두 번째 상환 시에 10달러를 지불하면 80만원이 남게 됩니다. 이런 식으로 10만원씩면서 10번 더 지불하면 대출금 전액을 지불하게 됩니다.
+</pre>