python model/train_reconstruct.py \ --experiment_name diffcr_bs8 \ --root3 data2/SEN12MSCR \ --model uncrtaints \ --encoder_widths [128] \ --decoder_widths [128,128,128,128,128] \ --out_conv 13 \ --mean_nonLinearity \ --var_nonLinearity softplus \ --use_sar \ --agg_mode att_group \ --encoder_norm group \ --decoder_norm batch \ --n_head 1 \ --d_model 256 \ --positional_encoding \ --d_k 4 \ --res_dir ./results \ --device cuda:0 \ --display_step 10 \ --batch_size 32 \ --num_workers 16 \ --lr 0.001 \ --gamma 0.8 \ --ref_date 2014-04-03 \ --pad_value 0 \ --padding_mode reflect \ --val_every 1 \ --val_after 0 \ --pretrain \ --input_t 1 \ --sample_type pretrain \ --vary_samples \ --min_cov 0.0 \ --max_cov 1.0 \ --region all \ --max_samples_count 1000000000 \ --plot_every -1 \ --loss l2 \ --covmode diag \ --scale_by 10.0 \ --epochs 20 \ --trained_checkp ""