Upload folder using huggingface_hub

Browse files

Files changed (14) hide show

.gitattributes +1 -0
README.md +1 -3
config.yml +131 -0
ctranslate2-model/config.json +9 -0
ctranslate2-model/model.bin +3 -0
ctranslate2-model/shared_vocabulary.json +0 -0
metadata.json +1 -0
opennmt/openmt.model_averaged.pt +3 -0
opennmt/openmt.vocab +0 -0
sentencepiece.model +3 -0
sentencepiece.vocab +0 -0
stanza/resources.json +0 -0
stanza/vep/tokenize/edt.pt +3 -0
translate-vep_ru-1_0.argosmodel +3 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+translate-vep_ru-1_0.argosmodel filter=lfs diff=lfs merge=lfs -text

README.md CHANGED Viewed

@@ -1,3 +1 @@
----
-license: cc-by-sa-4.0
----


1	+ # Veps - Russian version 1.0

config.yml ADDED Viewed

	@@ -0,0 +1,131 @@

+accum_count: 100
+accum_steps: 0
+adam_beta2: 0.998
+attention_dropout: 0.1
+batch_size: 1500
+batch_type: tokens
+bucket_size: 49304
+data:
+  27e6308e0faf12cd1b4bed73708fad6f:
+    path_src: dataset/vep-ru/et-synt/source.txt
+    path_tgt: dataset/vep-ru/et-synt/target.txt
+    src_prefix: et_s_Latn
+    tgt_prefix: ''
+    transforms: &id001
+    - sentencepiece
+    - filtertoolong
+    - prefix
+    weight: 37
+  2caaf1b1e5e15d4a06b5b77c438ba0bc:
+    path_src: dataset/vep-ru/fin-original/source.txt
+    path_tgt: dataset/vep-ru/fin-original/target.txt
+    src_prefix: fi_Latn
+    tgt_prefix: ''
+    transforms: *id001
+    weight: 37
+  3def7622ce4622202126c8828c6fae3f:
+    path_src: dataset/vep-ru/fin-synt/source.txt
+    path_tgt: dataset/vep-ru/fin-synt/target.txt
+    src_prefix: fi_s_Latn
+    tgt_prefix: ''
+    transforms: *id001
+    weight: 37
+  517216e92cd45eb876c79dc3bafaad18:
+    path_src: dataset/vep-ru/var/source.txt
+    path_tgt: dataset/vep-ru/var/target.txt
+    src_prefix: ''
+    tgt_prefix: ''
+    transforms: *id001
+    weight: 167
+  815e8e066d03025e82529ef5c5ad232c:
+    path_src: dataset/vep-ru/vep/source.txt
+    path_tgt: dataset/vep-ru/vep/target.txt
+    src_prefix: ''
+    tgt_prefix: ''
+    transforms: *id001
+    weight: 6
+  8e6d221db9fc70bb3fd1104c24c8f25c:
+    path_src: dataset/vep-ru/vep-dic/source.txt
+    path_tgt: dataset/vep-ru/vep-dic/target.txt
+    src_prefix: ''
+    tgt_prefix: ''
+    transforms: *id001
+    weight: 1
+  f080464d79eb04a44e9947db1b54c17b:
+    path_src: dataset/vep-ru/et-original/source.txt
+    path_tgt: dataset/vep-ru/et-original/target.txt
+    src_prefix: et_Latn
+    tgt_prefix: ''
+    transforms: *id001
+    weight: 37
+  valid:
+    path_src: run/vep_ru-1.0/src-val.txt
+    path_tgt: run/vep_ru-1.0/tgt-val.txt
+    transforms: *id001
+dec_layers: 20
+decay_method: rsqrt
+decoder_type: transformer
+dropout: 0.1
+dropout_steps: 0
+early_stopping: 0
+enc_layers: 20
+encoder_type: transformer
+gpu_ranks:
+- 0
+- 1
+heads: 8
+hidden_size: 512
+keep_checkpoint: 15
+label_smoothing: 0.1
+learning_rate: 0.005
+max_generator_batches: 2
+max_grad_norm: 0
+max_relative_positions: 20
+model_dtype: fp16
+normalization: tokens
+num_workers: 6
+optim: pagedadamw8bit
+param_init: 0
+param_init_glorot: true
+pos_ffn_activation_fn: gated-gelu
+position_encoding: false
+queue_size: 10000
+reset_optim: none
+rnn_size: 512
+save_checkpoint_steps: 500
+save_data: run/vep_ru-1.0/opennmt
+save_model: run/vep_ru-1.0/opennmt/openmt.model
+share_decoder_embeddings: true
+share_embeddings: true
+share_vocab: true
+skip_empty_level: silent
+src_onmttok_kwargs:
+  lang: vep
+  mode: none
+src_seq_length: 185
+src_subword_alpha: 0.0
+src_subword_model: run/vep_ru-1.0/sentencepiece.model
+src_subword_nbest: 1
+src_subword_type: sentencepiece
+src_vocab: run/vep_ru-1.0/opennmt/openmt.vocab
+src_vocab_size: 32000
+tgt_onmttok_kwargs:
+  lang: ru
+  mode: none
+tgt_seq_length: 185
+tgt_subword_alpha: 0.0
+tgt_subword_model: run/vep_ru-1.0/sentencepiece.model
+tgt_subword_nbest: 1
+tgt_subword_type: sentencepiece
+tgt_vocab: run/vep_ru-1.0/opennmt/openmt.vocab
+tgt_vocab_size: 32000
+train_steps: 2000
+transformer_ff: 6144
+update_vocab: 'False'
+valid_batch_size: 64
+valid_metrics:
+- BLEU
+valid_steps: 500
+warmup_steps: 500
+word_vec_size: 512
+world_size: 2

ctranslate2-model/config.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "add_source_bos": false,
+  "add_source_eos": false,
+  "bos_token": "<s>",
+  "decoder_start_token": "<s>",
+  "eos_token": "</s>",
+  "layer_norm_epsilon": null,
+  "unk_token": "<unk>"
+}

ctranslate2-model/model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d9db6dfd61f95f7f1edad42d81dae01e8025a92371b590ee43761d57620c7ac1
+size 460469083

ctranslate2-model/shared_vocabulary.json ADDED Viewed

The diff for this file is too large to render. See raw diff

metadata.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"package_version": "1.0", "argos_version": "1.9.0", "from_code": "vep", "from_name": "Veps", "to_code": "ru", "to_name": "Russian"}

opennmt/openmt.model_averaged.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3b1eb3318714e878a71229cb85ecb075009496b69edb0c53a7a7208712f8ab5c
+size 1960760662

opennmt/openmt.vocab ADDED Viewed

The diff for this file is too large to render. See raw diff

sentencepiece.model ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a602803c84fef522a000aa6eedfb440360cf2ffc9b5996cc57c8376be84eb6c6
+size 883660

sentencepiece.vocab ADDED Viewed

The diff for this file is too large to render. See raw diff

stanza/resources.json ADDED Viewed

The diff for this file is too large to render. See raw diff

stanza/vep/tokenize/edt.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d0ae6d383b373632bcf32b82fe726ecdd3aed0b3eb423ce86460f3157eed3db5
+size 633536

translate-vep_ru-1_0.argosmodel ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ba118915f5598a7054be3c988747f99b757ddb968458d11b3bad5e5c23f2ddce
+size 463118692