Trat80
/

AdemGPT

Trat80 commited on Nov 5, 2023

Commit

b235521

1 Parent(s): 1cffeaf

Create adem.python

Files changed (1) hide show

adem.python ADDED Viewed

+donde pongo este codigo? "from transformers import GPT2LMHeadModel, GPT2Tokenizer, TextDataset, DataCollatorForLanguageModeling
+from transformers import Trainer, TrainingArguments
+# Cargar el tokenizador y el modelo
+tokenizer = GPT2Tokenizer.from_pretrained('gpt2')
+model = GPT2LMHeadModel.from_pretrained('gpt2')
+# Ejemplo de datos de entrenamiento (necesitarás un conjunto de datos mucho más grande)
+train_data = ["Texto de ejemplo 1.", "Texto de ejemplo 2.", "Texto de ejemplo 3."]
+# Preparar el conjunto de datos
+train_encodings = tokenizer(train_data, truncation=True, padding=True)
+train_dataset = TextDataset(train_encodings)
+# Configuración de entrenamiento
+training_args = TrainingArguments(
+    output_dir='./AdemGPT_model',  # directorio de salida
+    overwrite_output_dir=True,
+    num_train_epochs=3,
+    per_device_train_batch_size=4,
+    save_steps=500,
+    save_total_limit=2
+)
+# Entrenamiento del modelo
+trainer = Trainer(
+    model=model,
+    args=training_args,
+    data_collator=DataCollatorForLanguageModeling(tokenizer=tokenizer),
+    train_dataset=train_dataset
+)
+trainer.train()
+"