frankmorales2020
/

Mistral-7B-text-to-sql-flash-attention-2-dataeval

Generated from Trainer

Model card Files Files and versions Community

frankmorales2020 commited on Jun 25, 2024

Commit

c6a9002

·

verified ·

1 Parent(s): 81230bf

Update README.md

Files changed (1) hide show

README.md +2 -1

README.md CHANGED Viewed

@@ -51,8 +51,9 @@ The following hyperparameters were used during training:
 from transformers import TrainingArguments
 args = TrainingArguments(
-    output_dir="Mistral-7B-text-to-sql-flash-attention-2-dataeval",    # directory to save and repository id
     num_train_epochs=3,                     # number of training epochs
     per_device_train_batch_size=3,          # batch size per device during training
     gradient_accumulation_steps=8,      #2  # number of steps before performing a backward/update pass

 from transformers import TrainingArguments
 args = TrainingArguments(
+    output_dir="Mistral-7B-text-to-sql-flash-attention-2-dataeval",
     num_train_epochs=3,                     # number of training epochs
     per_device_train_batch_size=3,          # batch size per device during training
     gradient_accumulation_steps=8,      #2  # number of steps before performing a backward/update pass