Spaces:

dushuai112233
/

LLM

Paused

dushuai112233 commited on Jan 3

Commit

e03b1b6

verified ·

1 Parent(s): 0edd576

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,17 +1,14 @@
-from accelerate import Accelerator
 from transformers import AutoModelForCausalLM, AutoTokenizer, Trainer, TrainingArguments
 from peft import LoraConfig, get_peft_model, TaskType
 from datasets import load_dataset
 import torch
 def main():
-    # 初始化 Accelerator
-    accelerator = Accelerator()
     # 基础模型位置
     model_name = "dushuai112233/Qwen2-1.5B-Instruct"
     # 设备
-    device = accelerator.device
     # 加载分词器和模型
     tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
@@ -39,7 +36,6 @@ def main():
     def tokenize_function(examples):
         return tokenizer(examples['question'], padding='max_length', truncation=True, max_length=128)
-    # 对训练集和验证集进行分词处理
     train_dataset = train_dataset.map(tokenize_function, batched=True)
     val_dataset = val_dataset.map(tokenize_function, batched=True)
@@ -56,9 +52,6 @@ def main():
         save_total_limit=2,                # 最大保存模型数
     )
-    # 将模型移到设备
-    model.to(device)
     # Define the Trainer
     trainer = Trainer(
         model=model,                       # 训练的模型
@@ -75,4 +68,4 @@ def main():
     model.save_pretrained('./output')
 if __name__ == '__main__':
-    main()

 from transformers import AutoModelForCausalLM, AutoTokenizer, Trainer, TrainingArguments
 from peft import LoraConfig, get_peft_model, TaskType
 from datasets import load_dataset
+from torch.utils.tensorboard import SummaryWriter
+import os
 import torch
 def main():
     # 基础模型位置
     model_name = "dushuai112233/Qwen2-1.5B-Instruct"
     # 设备
+    device = "cuda" if torch.cuda.is_available() else "cpu"
     # 加载分词器和模型
     tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
     def tokenize_function(examples):
         return tokenizer(examples['question'], padding='max_length', truncation=True, max_length=128)
     train_dataset = train_dataset.map(tokenize_function, batched=True)
     val_dataset = val_dataset.map(tokenize_function, batched=True)
         save_total_limit=2,                # 最大保存模型数
     )
     # Define the Trainer
     trainer = Trainer(
         model=model,                       # 训练的模型
     model.save_pretrained('./output')
 if __name__ == '__main__':
+    main()