AdemGPT / adem.python
Trat80's picture
Create adem.python
b235521
raw
history blame
1.11 kB
donde pongo este codigo? "from transformers import GPT2LMHeadModel, GPT2Tokenizer, TextDataset, DataCollatorForLanguageModeling
from transformers import Trainer, TrainingArguments
# Cargar el tokenizador y el modelo
tokenizer = GPT2Tokenizer.from_pretrained('gpt2')
model = GPT2LMHeadModel.from_pretrained('gpt2')
# Ejemplo de datos de entrenamiento (necesitarás un conjunto de datos mucho más grande)
train_data = ["Texto de ejemplo 1.", "Texto de ejemplo 2.", "Texto de ejemplo 3."]
# Preparar el conjunto de datos
train_encodings = tokenizer(train_data, truncation=True, padding=True)
train_dataset = TextDataset(train_encodings)
# Configuración de entrenamiento
training_args = TrainingArguments(
output_dir='./AdemGPT_model', # directorio de salida
overwrite_output_dir=True,
num_train_epochs=3,
per_device_train_batch_size=4,
save_steps=500,
save_total_limit=2
)
# Entrenamiento del modelo
trainer = Trainer(
model=model,
args=training_args,
data_collator=DataCollatorForLanguageModeling(tokenizer=tokenizer),
train_dataset=train_dataset
)
trainer.train()
"