joeykims
/

BEANs

Safetensors

Korean

Model card Files Files and versions Community

joeykims commited on Sep 15, 2024

Commit

982b2c3

0 Parent(s):

Feat: gemma coffee model

Browse files

Files changed (2) hide show

gemma_Ko_coffee.py +93 -0
gemma_Ko_coffee_load_model.py +46 -0

gemma_Ko_coffee.py ADDED Viewed

	@@ -0,0 +1,93 @@

+import torch
+# import os
+from datasets import Dataset
+from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline, TrainingArguments
+from peft import LoraConfig, PeftModel
+from trl import SFTTrainer
+import warnings
+# 특정 경고를 무시하도록 설정
+warnings.filterwarnings("ignore", category=FutureWarning, module="huggingface_hub.file_download")
+# 기기 설정 (CPU 또는 MPS)
+device = torch.device("cpu")
+# 데이터 로드
+data_path = "./data_finetunned/coffee_finetuning_20240914_witi_total.jsonl"
+dataset = Dataset.from_json(data_path)
+print("데이터셋 로드 완료")
+# 모델 및 토크나이저 로드
+BASE_MODEL = "beomi/gemma-ko-2b"
+model = AutoModelForCausalLM.from_pretrained(BASE_MODEL)
+model.to(device)
+tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL, add_special_tokens=True)
+# Prompt 생성 함수 수정 (instruction과 context 기반으로 생성)
+def generate_prompt(example):
+    prompt_list = []
+    for i in range(len(example['instruction'])):
+        prompt_list.append(f"""<bos><start_of_turn>user
+{example['instruction'][i]}<end_of_turn>
+<start_of_turn>model
+{example['response'][i]}<end_of_turn><eos>""")
+    return prompt_list
+# 데이터셋을 train 데이터로 설정
+train_data = dataset
+# 첫 번째 데이터의 프롬프트 확인
+print(generate_prompt(train_data[:1])[0])
+# LoRA 설정
+lora_config = LoraConfig(
+    r=6,
+    lora_alpha=8,
+    lora_dropout=0.05,
+    target_modules=["q_proj", "o_proj", "k_proj", "v_proj", "gate_proj", "up_proj", "down_proj"],
+    task_type="CAUSAL_LM",
+)
+# 모델 설정
+trainer = SFTTrainer(
+    model=model,
+    train_dataset=train_data,
+    max_seq_length=512,
+    args=TrainingArguments(
+        output_dir="outputs",
+        max_steps=3000,
+        per_device_train_batch_size=1,
+        gradient_accumulation_steps=4,
+        optim="adamw_torch",
+        warmup_steps=0.03,
+        learning_rate=2e-4,
+        fp16=False,
+        logging_steps=100,
+        push_to_hub=False,
+        report_to='none',
+        use_mps_device=False  # CPU로 설정
+    ),
+    peft_config=lora_config,
+    formatting_func=generate_prompt,  # 새로운 포맷팅 함수 적용
+)
+# 훈련 시작
+trainer.train()
+# 어댑터 모델 저장
+ADAPTER_MODEL = "lora_adapter"
+trainer.model.save_pretrained(ADAPTER_MODEL)
+# 최종 모델 병합 및 저장
+model = AutoModelForCausalLM.from_pretrained(BASE_MODEL, device_map='auto', torch_dtype=torch.float16)
+model = PeftModel.from_pretrained(model, ADAPTER_MODEL, device_map='auto', torch_dtype=torch.float16)
+model = model.merge_and_unload()
+model.save_pretrained('./gemma_outputs/gemma-ko-2b-beans-20240915-01')
+print("모델 저장 완료")
+# 토크나이저를 저장합니다.
+tokenizer.save_pretrained('./gemma_outputs/gemma-ko-2b-beans-20240915-01')
+print("tokenizer 저장 완료")

gemma_Ko_coffee_load_model.py ADDED Viewed

	@@ -0,0 +1,46 @@

+from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
+# 베이스 모델에서 토크나이저 불러오기
+tokenizer = AutoTokenizer.from_pretrained("google/gemma-2b-it")
+# 저장한 모델 경로
+model_dir = './gemma_outputs/gemma-2b-it-sum-ko-beans-1'
+model = AutoModelForCausalLM.from_pretrained(model_dir)
+# tokenizer = AutoTokenizer.from_pretrained(model_dir)
+# 모델을 CPU로 이동 (만약 GPU를 쓴다면 'cuda'로 바꿔줘)
+model.to("cpu") #cpu
+conversation_pipeline = pipeline("text-generation", model=model, tokenizer=tokenizer, max_new_tokens=512)
+def chat_with_model(input_text):
+    # 대화용 프롬프트를 생성
+    messages = [{"role": "user", "content": input_text}]
+    # 토크나이저로 입력을 프롬프트 형태로 변환
+    prompt = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
+    # 모델이 응답을 생성
+    # response = conversation_pipeline(prompt, do_sample=True, temperature=0.7, top_k=50, top_p=0.95)
+    response = conversation_pipeline(prompt, do_sample=True, temperature=0.2, top_k=50, top_p=0.95, add_special_tokens=True)
+    # 모델의 생성된 응답 추출
+    generated_text = response[0]["generated_text"]
+    model_response = generated_text[len(prompt):]  # 입력 프롬프트를 제거하고 응답만 반환
+    return model_response
+# 대화를 계속 이어나갈 수 있는 구조
+def interactive_chat():
+    print("대화형 모드에 오신 것을 환영합니다! '종료'라고 입력하면 대화가 종료됩니다.")
+    while True:
+        user_input = input("사용자: ")  # 사용자 입력 받기
+        if user_input.lower() == "종료":  # '종료'라고 입력하면 대화 종료
+            print("대화를 종료합니다.")
+            break
+        model_reply = chat_with_model(user_input)  # 모델의 응답 받기
+        print(f"모델: {model_reply}")  # 모델의 응답 출력
+# 대화 시작
+interactive_chat()