Azperia
/

Thought_1.0_Poet_IQ150

Model card Files Files and versions Community

Thought_1.0_Poet_IQ150 / train_model.py

Azperia's picture

Create train_model.py

9873cb7 verified 9 days ago

history blame contribute delete

1.29 kB

	from transformers import GPT2Tokenizer, GPT2LMHeadModel, Trainer, TrainingArguments, TextDataset, DataCollatorForLanguageModeling

	# Charger le modèle et le tokenizer GPT-2
	model_name = "gpt2"
	tokenizer = GPT2Tokenizer.from_pretrained(model_name)
	model = GPT2LMHeadModel.from_pretrained(model_name)

	# Préparer ton dataset (assure-toi que 'train.txt' existe avec tes données)
	def load_dataset(file_path, tokenizer, block_size=128):
	return TextDataset(
	tokenizer=tokenizer,
	file_path=file_path,
	block_size=block_size
	)

	# Charger le dataset
	train_dataset = load_dataset("train.txt", tokenizer)

	# Préparer les arguments pour l'entraînement
	training_args = TrainingArguments(
	output_dir="./thought_model",
	overwrite_output_dir=True,
	num_train_epochs=3,
	per_device_train_batch_size=2,
	save_steps=500,
	save_total_limit=2
	)

	# Préparer le data collator
	data_collator = DataCollatorForLanguageModeling(
	tokenizer=tokenizer,
	mlm=False
	)

	# Lancer l'entraînement
	trainer = Trainer(
	model=model,
	args=training_args,
	data_collator=data_collator,
	train_dataset=train_dataset
	)

	trainer.train()

	# Sauvegarder le modèle fine-tuné
	trainer.save_model("./thought_model")
	tokenizer.save_pretrained("./thought_model")