:[omegaconf.dictconfig DictConfig)}( _metadataomegaconf.baseContainerMetadata)}(ref_typebuiltinsdict object_typeNoptionalkeyNflags}structsresolver_cache collections defaultdicthRkey_typeN element_typeNub_parentN_content}(_nameomegaconf.nodesAnyNode)}(hhMetadata)}(h typingAnyhNhhh h}hhhRubhh_valNubcommonh)}(hh)}(h h,hNhhh1h}hhhRhNhNubhhh}(h h#)}(hh')}(h h,hNhhh h}hhhRubhh2h0Nubno_progress_barh#)}(hh')}(h h,hNhhhAh}hhhRubhh2h0ub log_intervalh#)}(hh')}(h h,hNhhhIh}hhhRubhh2h0Kdub log_formath#)}(hh')}(h h,hNhhhQh}hhhRubhh2h0Nublog_fileh#)}(hh')}(h h,hNhhhYh}hhhRubhh2h0Nubaim_repoh#)}(hh')}(h h,hNhhhah}hhhRubhh2h0Nub aim_run_hashh#)}(hh')}(h h,hNhhhih}hhhRubhh2h0Nubtensorboard_logdirh#)}(hh')}(h h,hNhhhqh}hhhRubhh2h0Nub wandb_projecth#)}(hh')}(h h,hNhhhyh}hhhRubhh2h0Nubazureml_loggingh#)}(hh')}(h h,hNhhhh}hhhRubhh2h0ubseedh#)}(hh')}(h h,hNhhhh}hhhRubhh2h0Kubcpuh#)}(hh')}(h h,hNhhhh}hhhRubhh2h0ubtpuh#)}(hh')}(h h,hNhhhh}hhhRubhh2h0ubbf16h#)}(hh')}(h h,hNhhhh}hhhRubhh2h0ubmemory_efficient_bf16h#)}(hh')}(h h,hNhhhh}hhhRubhh2h0ubfp16h#)}(hh')}(h h,hNhhhh}hhhRubhh2h0ubmemory_efficient_fp16h#)}(hh')}(h h,hNhhhh}hhhRubhh2h0ubfp16_no_flatten_gradsh#)}(hh')}(h h,hNhhhh}hhhRubhh2h0ubfp16_init_scaleh#)}(hh')}(h h,hNhhhh}hhhRubhh2h0Kubfp16_scale_windowh#)}(hh')}(h h,hNhhhh}hhhRubhh2h0Nubfp16_scale_toleranceh#)}(hh')}(h h,hNhhhh}hhhRubhh2h0Gubon_cpu_convert_precisionh#)}(hh')}(h h,hNhhhh}hhhRubhh2h0ubmin_loss_scaleh#)}(hh')}(h h,hNhhhh}hhhRubhh2h0G?6C-ubthreshold_loss_scaleh#)}(hh')}(h h,hNhhhh}hhhRubhh2h0Nubamph#)}(hh')}(h h,hNhhhh}hhhRubhh2h0ubamp_batch_retriesh#)}(hh')}(h h,hNhhjh}hhhRubhh2h0Kubamp_init_scaleh#)}(hh')}(h h,hNhhj h}hhhRubhh2h0Kubamp_scale_windowh#)}(hh')}(h h,hNhhjh}hhhRubhh2h0Nubuser_dirh#)}(hh')}(h h,hNhhjh}hhhRubhh2h0mcoltubempty_cache_freqh#)}(hh')}(h h,hNhhj"h}hhhRubhh2h0Kuball_gather_list_sizeh#)}(hh')}(h h,hNhhj*h}hhhRubhh2h0M@ubmodel_parallel_sizeh#)}(hh')}(h h,hNhhj2h}hhhRubhh2h0Kubquantization_config_pathh#)}(hh')}(h h,hNhhj:h}hhhRubhh2h0Nubprofileh#)}(hh')}(h h,hNhhjBh}hhhRubhh2h0ub reset_loggingh#)}(hh')}(h h,hNhhjJh}hhhRubhh2h0ubsuppress_crashesh#)}(hh')}(h h,hNhhjRh}hhhRubhh2h0ubuse_plasma_viewh#)}(hh')}(h h,hNhhjZh}hhhRubhh2h0ub plasma_pathh#)}(hh')}(h h,hNhhjbh}hhhRubhh2h0 /tmp/plasmaubuub common_evalh)}(hh)}(h h,hNhhjkh}hhhRhNhNubhhh}(h h#)}(hh')}(h h,hNhhh h}hhhRubhjlh0Nubpathh#)}(hh')}(h h,hNhhj{h}hhhRubhjlh012e12d_last.ptub post_processh#)}(hh')}(h h,hNhhjh}hhhRubhjlh0 subword_nmtubquieth#)}(hh')}(h h,hNhhjh}hhhRubhjlh0ubmodel_overridesh#)}(hh')}(h h,hNhhjh}hhhRubhjlh0{}ub results_pathh#)}(hh')}(h h,hNhhjh}hhhRubhjlh0Nubuubdistributed_trainingh)}(hh)}(h h,hNhhjh}hhhRhNhNubhhh}(h h#)}(hh')}(h h,hNhhh h}hhhRubhjh0Nubdistributed_world_sizeh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Kubdistributed_num_procsh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Kubdistributed_rankh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Kubdistributed_backendh#)}(hh')}(h h,hNhhjh}hhhRubhjh0ncclubdistributed_init_methodh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Nubdistributed_porth#)}(hh')}(h h,hNhhjh}hhhRubhjh0Jub device_idh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Kubdistributed_no_spawnh#)}(hh')}(h h,hNhhjh}hhhRubhjh0ub ddp_backendh#)}(hh')}(h h,hNhhjh}hhhRubhjh0 pytorch_ddpub ddp_comm_hookh#)}(hh')}(h h,hNhhjh}hhhRubhjh0noneub bucket_cap_mbh#)}(hh')}(h h,hNhhj h}hhhRubhjh0Kubfix_batches_to_gpush#)}(hh')}(h h,hNhhjh}hhhRubhjh0ubfind_unused_parametersh#)}(hh')}(h h,hNhhjh}hhhRubhjh0ubgradient_as_bucket_viewh#)}(hh')}(h h,hNhhj!h}hhhRubhjh0ubfast_stat_synch#)}(hh')}(h h,hNhhj)h}hhhRubhjh0ubheartbeat_timeouth#)}(hh')}(h h,hNhhj1h}hhhRubhjh0Jubbroadcast_buffersh#)}(hh')}(h h,hNhhj9h}hhhRubhjh0ubslowmo_momentumh#)}(hh')}(h h,hNhhjAh}hhhRubhjh0Nubslowmo_base_algorithmh#)}(hh')}(h h,hNhhjIh}hhhRubhjh0localsgdublocalsgd_frequencyh#)}(hh')}(h h,hNhhjRh}hhhRubhjh0Kubnprocs_per_nodeh#)}(hh')}(h h,hNhhjZh}hhhRubhjh0Kubpipeline_model_parallelh#)}(hh')}(h h,hNhhjbh}hhhRubhjh0ubpipeline_balanceh#)}(hh')}(h h,hNhhjjh}hhhRubhjh0Nubpipeline_devicesh#)}(hh')}(h h,hNhhjrh}hhhRubhjh0Nubpipeline_chunksh#)}(hh')}(h h,hNhhjzh}hhhRubhjh0Kubpipeline_encoder_balanceh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Nubpipeline_encoder_devicesh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Nubpipeline_decoder_balanceh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Nubpipeline_decoder_devicesh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Nubpipeline_checkpointh#)}(hh')}(h h,hNhhjh}hhhRubhjh0neverub zero_shardingh#)}(hh')}(h h,hNhhjh}hhhRubhjh0jubhh#)}(hh')}(h h,hNhhhh}hhhRubhjh0ubhh#)}(hh')}(h h,hNhhhh}hhhRubhjh0ubhh#)}(hh')}(h h,hNhhhh}hhhRubhjh0ubno_reshard_after_forwardh#)}(hh')}(h h,hNhhjh}hhhRubhjh0ubfp32_reduce_scatterh#)}(hh')}(h h,hNhhjh}hhhRubhjh0ub cpu_offloadh#)}(hh')}(h h,hNhhjh}hhhRubhjh0ubuse_sharded_stateh#)}(hh')}(h h,hNhhjh}hhhRubhjh0ubnot_fsdp_flatten_parametersh#)}(hh')}(h h,hNhhjh}hhhRubhjh0ubuubdataseth)}(hh)}(h h,hNhhjh}hhhRhNhNubhhh}(h h#)}(hh')}(h h,hNhhh h}hhhRubhjh0Nub num_workersh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Kub#skip_invalid_size_inputs_valid_testh#)}(hh')}(h h,hNhhjh}hhhRubhjh0ub max_tokensh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Mub batch_sizeh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Nubrequired_batch_size_multipleh#)}(hh')}(h h,hNhhj h}hhhRubhjh0Kubrequired_seq_len_multipleh#)}(hh')}(h h,hNhhj(h}hhhRubhjh0Kub dataset_implh#)}(hh')}(h h,hNhhj0h}hhhRubhjh0Nubdata_buffer_sizeh#)}(hh')}(h h,hNhhj8h}hhhRubhjh0K ub train_subseth#)}(hh')}(h h,hNhhj@h}hhhRubhjh0trainub valid_subseth#)}(hh')}(h h,hNhhjIh}hhhRubhjh0validubcombine_valid_subsetsh#)}(hh')}(h h,hNhhjRh}hhhRubhjh0Nubignore_unused_valid_subsetsh#)}(hh')}(h h,hNhhjZh}hhhRubhjh0ubvalidate_intervalh#)}(hh')}(h h,hNhhjbh}hhhRubhjh0Kubvalidate_interval_updatesh#)}(hh')}(h h,hNhhjjh}hhhRubhjh0Kubvalidate_after_updatesh#)}(hh')}(h h,hNhhjrh}hhhRubhjh0Kubfixed_validation_seedh#)}(hh')}(h h,hNhhjzh}hhhRubhjh0Nubdisable_validationh#)}(hh')}(h h,hNhhjh}hhhRubhjh0ubmax_tokens_validh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Mubbatch_size_validh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Nubmax_valid_stepsh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Nub curriculumh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Kub gen_subseth#)}(hh')}(h h,hNhhjh}hhhRubhjh0testub num_shardsh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Kubshard_idh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Kubgrouped_shufflingh#)}(hh')}(h h,hNhhjh}hhhRubhjh0ubupdate_epoch_batch_itrh#)}(hh')}(h h,hNhhjh}hhhRubhjh0ubupdate_ordered_indices_seedh#)}(hh')}(h h,hNhhjh}hhhRubhjh0ubuub optimizationh)}(hh)}(h h,hNhhjh}hhhRhNhNubhhh}(h h#)}(hh')}(h h,hNhhh h}hhhRubhjh0Nub max_epochh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Kub max_updateh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Kubstop_time_hoursh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Gub clip_normh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Gub sentence_avgh#)}(hh')}(h h,hNhhj h}hhhRubhjh0ub update_freqomegaconf.listconfig ListConfig)}(hh)}(h h,hh listhhjh}hhhRhh inthNubhjh]h#)}(hh')}(h h,hNhhKh}hhhRubhjh0Kubaublrj)}(hh)}(h h,hjhhj*h}hhhRhj!hNubhjh]h#)}(hh')}(h h,hNhhKh}hhhRubhj+h0G?ubaub stop_min_lrh#)}(hh')}(h h,hNhhj:h}hhhRubhjh0Gubuse_bmufh#)}(hh')}(h h,hNhhjBh}hhhRubhjh0ubskip_remainder_batchh#)}(hh')}(h h,hNhhjJh}hhhRubhjh0ubdebug_param_namesh#)}(hh')}(h h,hNhhjRh}hhhRubhjh0ubuub checkpointh)}(hh)}(h h,hNhhjZh}hhhRhNhNubhhh}(h h#)}(hh')}(h h,hNhhh h}hhhRubhj[h0Nubsave_dirh#)}(hh')}(h h,hNhhjjh}hhhRubhj[h0 checkpointsub restore_fileh#)}(hh')}(h h,hNhhjsh}hhhRubhj[h0checkpoint_last.ptub continue_onceh#)}(hh')}(h h,hNhhj|h}hhhRubhj[h0Nubfinetune_from_modelh#)}(hh')}(h h,hNhhjh}hhhRubhj[h0Nubreset_dataloaderh#)}(hh')}(h h,hNhhjh}hhhRubhj[h0ubreset_lr_schedulerh#)}(hh')}(h h,hNhhjh}hhhRubhj[h0ub reset_metersh#)}(hh')}(h h,hNhhjh}hhhRubhj[h0ubreset_optimizerh#)}(hh')}(h h,hNhhjh}hhhRubhj[h0uboptimizer_overridesh#)}(hh')}(h h,hNhhjh}hhhRubhj[h0{}ub save_intervalh#)}(hh')}(h h,hNhhjh}hhhRubhj[h0Kubsave_interval_updatesh#)}(hh')}(h h,hNhhjh}hhhRubhj[h0Kubkeep_interval_updatesh#)}(hh')}(h h,hNhhjh}hhhRubhj[h0Jubkeep_interval_updates_patternh#)}(hh')}(h h,hNhhjh}hhhRubhj[h0Jubkeep_last_epochsh#)}(hh')}(h h,hNhhjh}hhhRubhj[h0Jubkeep_best_checkpointsh#)}(hh')}(h h,hNhhjh}hhhRubhj[h0Jubno_saveh#)}(hh')}(h h,hNhhjh}hhhRubhj[h0ubno_epoch_checkpointsh#)}(hh')}(h h,hNhhjh}hhhRubhj[h0ubno_last_checkpointsh#)}(hh')}(h h,hNhhjh}hhhRubhj[h0ubno_save_optimizer_stateh#)}(hh')}(h h,hNhhjh}hhhRubhj[h0ubbest_checkpoint_metrich#)}(hh')}(h h,hNhhjh}hhhRubhj[h0lossubmaximize_best_checkpoint_metrich#)}(hh')}(h h,hNhhjh}hhhRubhj[h0ubpatienceh#)}(hh')}(h h,hNhhjh}hhhRubhj[h0Jubcheckpoint_suffixh#)}(hh')}(h h,hNhhjh}hhhRubhj[h0ubcheckpoint_shard_counth#)}(hh')}(h h,hNhhj'h}hhhRubhj[h0Kubload_checkpoint_on_all_dp_ranksh#)}(hh')}(h h,hNhhj/h}hhhRubhj[h0ub write_checkpoints_asynchronouslyh#)}(hh')}(h h,hNhhj7h}hhhRubhj[h0ubj2h#)}(hh')}(h h,hNhhj2h}hhhRubhj[h0Kubuubbmufh)}(hh)}(h h,hNhhjFh}hhhRhNhNubhhh}(h h#)}(hh')}(h h,hNhhh h}hhhRubhjGh0Nubblock_lrh#)}(hh')}(h h,hNhhjVh}hhhRubhjGh0G?ubblock_momentumh#)}(hh')}(h h,hNhhj^h}hhhRubhjGh0G?ubglobal_sync_iterh#)}(hh')}(h h,hNhhjfh}hhhRubhjGh0K2ubwarmup_iterationsh#)}(hh')}(h h,hNhhjnh}hhhRubhjGh0Mubuse_nbmh#)}(hh')}(h h,hNhhjvh}hhhRubhjGh0ub average_synch#)}(hh')}(h h,hNhhj~h}hhhRubhjGh0ubjh#)}(hh')}(h h,hNhhjh}hhhRubhjGh0Kubuub generationh)}(hh)}(h h,hNhhjh}hhhRhNhNubhhh}(h h#)}(hh')}(h h,hNhhh h}hhhRubhjh0Nubbeamh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Kubbeam_mth#)}(hh')}(h h,hNhhjh}hhhRubhjh0Kubnbesth#)}(hh')}(h h,hNhhjh}hhhRubhjh0Kub max_len_ah#)}(hh')}(h h,hNhhjh}hhhRubhjh0Gub max_len_bh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Kub max_len_a_mth#)}(hh')}(h h,hNhhjh}hhhRubhjh0Gub max_len_b_mth#)}(hh')}(h h,hNhhjh}hhhRubhjh0Kubmin_lenh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Kubmatch_source_lenh#)}(hh')}(h h,hNhhjh}hhhRubhjh0ub unnormalizedh#)}(hh')}(h h,hNhhjh}hhhRubhjh0ub no_early_stoph#)}(hh')}(h h,hNhhjh}hhhRubhjh0ubno_beamable_mmh#)}(hh')}(h h,hNhhjh}hhhRubhjh0ublenpenh#)}(hh')}(h h,hNhhjh}hhhRubhjh0G?ub lenpen_mth#)}(hh')}(h h,hNhhjh}hhhRubhjh0G?ubunkpenh#)}(hh')}(h h,hNhhj h}hhhRubhjh0Gub replace_unkh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Nub sacrebleuh#)}(hh')}(h h,hNhhjh}hhhRubhjh0ubscore_referenceh#)}(hh')}(h h,hNhhj%h}hhhRubhjh0ub prefix_sizeh#)}(hh')}(h h,hNhhj-h}hhhRubhjh0Kubno_repeat_ngram_sizeh#)}(hh')}(h h,hNhhj5h}hhhRubhjh0Kubsamplingh#)}(hh')}(h h,hNhhj=h}hhhRubhjh0ub sampling_topkh#)}(hh')}(h h,hNhhjEh}hhhRubhjh0Jub sampling_topph#)}(hh')}(h h,hNhhjMh}hhhRubhjh0Gub constraintsh#)}(hh')}(h h,hNhhjUh}hhhRubhjh0Nub temperatureh#)}(hh')}(h h,hNhhj]h}hhhRubhjh0G?ubdiverse_beam_groupsh#)}(hh')}(h h,hNhhjeh}hhhRubhjh0Jubdiverse_beam_strengthh#)}(hh')}(h h,hNhhjmh}hhhRubhjh0G?ubdiversity_rateh#)}(hh')}(h h,hNhhjuh}hhhRubhjh0Gubprint_alignmenth#)}(hh')}(h h,hNhhj}h}hhhRubhjh0Nub print_steph#)}(hh')}(h h,hNhhjh}hhhRubhjh0ublm_pathh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Nub lm_weighth#)}(hh')}(h h,hNhhjh}hhhRubhjh0Gubiter_decode_eos_penaltyh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Gubiter_decode_max_iterh#)}(hh')}(h h,hNhhjh}hhhRubhjh0K ubiter_decode_force_max_iterh#)}(hh')}(h h,hNhhjh}hhhRubhjh0ubiter_decode_with_beamh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Kub"iter_decode_with_external_rerankerh#)}(hh')}(h h,hNhhjh}hhhRubhjh0ubretain_iter_historyh#)}(hh')}(h h,hNhhjh}hhhRubhjh0ubretain_dropouth#)}(hh')}(h h,hNhhjh}hhhRubhjh0ubretain_dropout_modulesh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Nubdecoding_formath#)}(hh')}(h h,hNhhjh}hhhRubhjh0Nubno_seed_providedh#)}(hh')}(h h,hNhhjh}hhhRubhjh0ub eos_tokenh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Nubuubeval_lmh)}(hh)}(h h,hNhhjh}hhhRhNhNubhhh}(h h#)}(hh')}(h h,hNhhh h}hhhRubhjh0Nuboutput_word_probsh#)}(hh')}(h h,hNhhjh}hhhRubhjh0uboutput_word_statsh#)}(hh')}(h h,hNhhj h}hhhRubhjh0ubcontext_windowh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Kub softmax_batchh#)}(hh')}(h h,hNhhjh}hhhRubhjh0ubuub interactiveh)}(hh)}(h h,hNhhj%h}hhhRhNhNubhhh}(h h#)}(hh')}(h h,hNhhh h}hhhRubhj&h0Nub buffer_sizeh#)}(hh')}(h h,hNhhj5h}hhhRubhj&h0Kubinputh#)}(hh')}(h h,hNhhj=h}hhhRubhj&h0input.enubuubmodelh#)}(hh')}(h h,hNhhjFh}hhhRubhhh0Nubtaskh#)}(hh')}(h h,hNhhjNh}hhhRubhhh0argparse Namespace)}(hAhIKdhQNhYNhaNhiNhqNhyNhhKhhhhhhhhKhNhGhhG?6C-hNhjKj KjNjmcoltj"Kj*M@j2Kj:NjBjJjRjZjb /tmp/plasma criterion cross_entropy tokenizermosesbpe subword_nmt optimizerN lr_schedulerfixedscoringbleujNtranslation_w_langtokjKjjMjNj Kj(Kj0Nj8K j@trainjIvalidjRNjZjbKjjKjrKjzNjjMjNjNjKjtestjKjKjjjjKjKjKjnccljNjJjKjjjjjj Kjjj!j)j1Jj9jANjIlocalsgdjRKjZKjbjjNjrNjzKjNjNjNjNjjjjjjjjjj{12e12d_last.ptj subword_nmtjj{}jNjKjKjKjKjKjKjKjKjjjjjKjKj KjNjj%j-Kj5Kj=jEJjMGjUNj]G?jeJjmG?juGj}NjjNjGjGjK jjKjjjjNjNjjNjj checkpointsjscheckpoint_last.ptj|NjNjjjjjjpjKjKjJjJjJjJjjjjjlossjjJjj&j'Kj/j7j5Kj=input.endata ./data-bin source_langzh target_langenload_alignmentsleft_pad_sourceTrueleft_pad_targetFalsemax_source_positionsMmax_target_positionsMupsample_primaryKtruncate_sourcenum_batch_bucketsKlang_prefix_tok LANG_TOK_ES eval_bleueval_bleu_detokspaceeval_bleu_detok_argsNeval_tokenized_bleueval_bleu_remove_bpeNeval_bleu_argsNeval_bleu_print_samplesmoses_no_dash_splitsmoses_no_escape bpe_codescodes.bpe.32000 bpe_separator@@ force_annealN lr_shrinkG?warmup_updatesKpadKeosKunkKh jhububj]h)}(hh)}(h h,hNhhj]h}hhhRhNhNubhhh}(h h#)}(hh')}(h h,hNhhh h}hhhRubhjh0 cross_entropyubj h#)}(hh')}(h h,hNhhj h}hhhRubhjh0ubuubjch#)}(hh')}(h h,hNhhjch}hhhRubhhh0Nubjdh)}(hh)}(h h,hNhhjdh}hhhRhNhNubhhh}(h h#)}(hh')}(h h,hNhhh h}hhhRubhjh0fixedubjh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Nubjh#)}(hh')}(h h,hNhhjh}hhhRubhjh0G?ubjh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Kubj*j)}(hh)}(h h,hjhhj*h}hhhRhj!hNubhjh]h#)}(hh')}(h h,hNhhKh}hhhRubhjh0G?ubaubuubjfh)}(hh)}(h h,hNhhjfh}hhhRhNhNubhhh}(h h#)}(hh')}(h h,hNhhh h}hhhRubhjh0bleuubjh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Kubjh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Kubjh#)}(hh')}(h h,hNhhjh}hhhRubhjh0Kubuubjah)}(hh)}(h h,hNhhjah}hhhRhNhNubhhh}(h h#)}(hh')}(h h,hNhhh h}hhhRubhjh0 subword_nmtubjh#)}(hh')}(h h,hNhhjh}hhhRubhjh0codes.bpe.32000ubjh#)}(hh')}(h h,hNhhjh}hhhRubhjh0@@ubuubj_h)}(hh)}(h h,hNhhj_h}hhhRhNhNubhhh}(h h#)}(hh')}(h h,hNhhh h}hhhRubhj2h0mosesubjwh#)}(hh')}(h h,hNhhjwh}hhhRubhj2h0zhubjyh#)}(hh')}(h h,hNhhjyh}hhhRubhj2h0enubjh#)}(hh')}(h h,hNhhjh}hhhRubhj2h0ubjh#)}(hh')}(h h,hNhhjh}hhhRubhj2h0ubuubemah)}(hh)}(h h,hNhhj`h}hhhRhNhNubhhh}(h h#)}(hh')}(h h,hNhhh h}hhhRubhjah0Nub store_emah#)}(hh')}(h h,hNhhjph}hhhRubhjah0ub ema_decayh#)}(hh')}(h h,hNhhjxh}hhhRubhjah0G?.Hubema_start_updateh#)}(hh')}(h h,hNhhjh}hhhRubhjah0Kubema_seed_modelh#)}(hh')}(h h,hNhhjh}hhhRubhjah0Nubema_update_freqh#)}(hh')}(h h,hNhhjh}hhhRubhjah0Kubema_fp32h#)}(hh')}(h h,hNhhjh}hhhRubhjah0ubuubuub.