frankmorales2020
/

Mistral-7B-text-to-sql-flash-attention-2-dataeval

Generated from Trainer

Model card Files Files and versions Community

frankmorales2020 commited on Jun 25, 2024

Commit

053207b

·

verified ·

1 Parent(s): 4b47e25

Update README.md

Files changed (1) hide show

README.md +2 -1

README.md CHANGED Viewed

@@ -51,7 +51,8 @@ The following hyperparameters were used during training:
 from transformers import TrainingArguments
 args = TrainingArguments(
-    output_dir="Mistral-7B-text-to-sql-flash-attention-2-dataeval",
     num_train_epochs=3,                     # number of training epochs
     per_device_train_batch_size=3,          # batch size per device during training
     gradient_accumulation_steps=8,      #2  # number of steps before performing a backward/update pass

 from transformers import TrainingArguments
 args = TrainingArguments(
+    output_dir="Mistral-7B-text-to-sql-flash-attention-2-dataeval",
     num_train_epochs=3,                     # number of training epochs
     per_device_train_batch_size=3,          # batch size per device during training
     gradient_accumulation_steps=8,      #2  # number of steps before performing a backward/update pass