juancopi81
/

mutopia_guitar_mmm

@@ -49,6 +49,9 @@ For the first epochs of training, I transposed the notes by raising and lowering
 ### Training hyperparameters
 The following hyperparameters were used during training (with transposition):
 - optimizer: {'name': 'AdamWeightDecay', 'learning_rate': {'class_name': 'WarmUp', 'config': {'initial_learning_rate': 5e-07, 'decay_schedule_fn': {'class_name': 'PolynomialDecay', 'config': {'initial_learning_rate': 5e-07, 'decay_steps': 5726, 'end_learning_rate': 0.0, 'power': 1.0, 'cycle': False, 'name': None}, 'passive_serialization': True}, 'warmup_steps': 1000, 'power': 1.0, 'name': None}}, 'decay': 0.0, 'beta_1': 0.9, 'beta_2': 0.999, 'epsilon': 1e-08, 'amsgrad': False, 'weight_decay_rate': 0.01}
@@ -73,10 +76,13 @@ The following hyperparameters were used during training (without transposition,
 The following hyperparameters were used during training (without transposition, new tokenizer - seventh round):
 - optimizer: {'name': 'AdamWeightDecay', 'learning_rate': {'class_name': 'WarmUp', 'config': {'initial_learning_rate': 0.0005, 'decay_schedule_fn': {'class_name': 'PolynomialDecay', 'config': {'initial_learning_rate': 0.0005, 'decay_steps': 1025, 'end_learning_rate': 0.0, 'power': 1.0, 'cycle': False, 'name': None}, 'passive_serialization': True}, 'warmup_steps': 1000, 'power': 1.0, 'name': None}}, 'decay': 0.0, 'beta_1': 0.9, 'beta_2': 0.999, 'epsilon': 1e-08, 'amsgrad': False, 'weight_decay_rate': 0.01}
 - training_precision: mixed_float16
 ### Training results
 Using transposition:
 | Train Loss | Validation Loss | Epoch |
 |:----------:|:---------------:|:-----:|
@@ -193,7 +199,7 @@ Without transposition (seventh round - new tokenizer):
 | 0.3223 | 1.7940 | 12 |
 | 0.2158 | 1.9032 | 13 |
 | 0.1448 | 1.9892 | 14 |
 ### Framework versions
 - Transformers 4.22.1

 ### Training hyperparameters
+<details>
+<summary>Click to expand</summary>
 The following hyperparameters were used during training (with transposition):
 - optimizer: {'name': 'AdamWeightDecay', 'learning_rate': {'class_name': 'WarmUp', 'config': {'initial_learning_rate': 5e-07, 'decay_schedule_fn': {'class_name': 'PolynomialDecay', 'config': {'initial_learning_rate': 5e-07, 'decay_steps': 5726, 'end_learning_rate': 0.0, 'power': 1.0, 'cycle': False, 'name': None}, 'passive_serialization': True}, 'warmup_steps': 1000, 'power': 1.0, 'name': None}}, 'decay': 0.0, 'beta_1': 0.9, 'beta_2': 0.999, 'epsilon': 1e-08, 'amsgrad': False, 'weight_decay_rate': 0.01}
 The following hyperparameters were used during training (without transposition, new tokenizer - seventh round):
 - optimizer: {'name': 'AdamWeightDecay', 'learning_rate': {'class_name': 'WarmUp', 'config': {'initial_learning_rate': 0.0005, 'decay_schedule_fn': {'class_name': 'PolynomialDecay', 'config': {'initial_learning_rate': 0.0005, 'decay_steps': 1025, 'end_learning_rate': 0.0, 'power': 1.0, 'cycle': False, 'name': None}, 'passive_serialization': True}, 'warmup_steps': 1000, 'power': 1.0, 'name': None}}, 'decay': 0.0, 'beta_1': 0.9, 'beta_2': 0.999, 'epsilon': 1e-08, 'amsgrad': False, 'weight_decay_rate': 0.01}
 - training_precision: mixed_float16
+</details>
 ### Training results
+<details>
+<summary>Click to expand</summary>
 Using transposition:
 | Train Loss | Validation Loss | Epoch |
 |:----------:|:---------------:|:-----:|
 | 0.3223 | 1.7940 | 12 |
 | 0.2158 | 1.9032 | 13 |
 | 0.1448 | 1.9892 | 14 |
+</details>
 ### Framework versions
 - Transformers 4.22.1