#!/bin/bash #SBATCH -C gpu #SBATCH -G 40 #SBATCH -N 10 #SBATCH --ntasks=40 #SBATCH --ntasks-per-node=4 #SBATCH --cpus-per-task=4 #SBATCH --time=6:00:00 #SBATCH --time-min=02:00:00 #SBATCH --error=%x-%j.err #SBATCH --output=%x-%j.out #SBATCH --requeue #SBATCH --exclusive #SBATCH --open-mode=append exp_name=$(basename "$SLURM_SUBMIT_DIR") srun python run_train.py \ --name=$exp_name \ --train_file="train.h5" \ --valid_file="valid.h5" \ --statistics_file="statistics.json" \ --energy_weight=1 \ --forces_weight=1 \ --eval_interval=1 \ --config_type_weights='{"Default":1.0}' \ --E0s='average' \ --error_table='PerAtomMAE' \ --stress_key='stress' \ --model="ScaleShiftMACE" \ --MLP_irreps="64x0e" \ --interaction_first="RealAgnosticResidualInteractionBlock" \ --interaction="RealAgnosticResidualInteractionBlock" \ --num_interactions=2 \ --num_channels=128 \ --max_ell=3 \ --hidden_irreps='64x0e + 64x1o + 64x2e' \ --num_cutoff_basis=10 \ --lr=1e-2 \ --correlation=3 \ --r_max=6.0 \ --num_radial_basis=10 \ --scaling='rms_forces_scaling' \ --distributed \ --num_workers=4 \ --batch_size=10 \ --valid_batch_size=30 \ --max_num_epochs=500 \ --patience=250 \ --amsgrad \ --weight_decay=1e-8 \ --ema \ --ema_decay=0.999 \ --default_dtype="float32"\ --clip_grad=100 \ --device=cuda \ --seed=3 \ --save_cpu \ --restart_latest &