kepinsam commited on
Commit
e47f8b1
1 Parent(s): 2989313

Training in progress, step 500

Browse files
added_tokens.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ {
2
+ "btk_Latn": 256204
3
+ }
generation_config.json CHANGED
@@ -1,8 +1,6 @@
1
  {
2
  "bos_token_id": 0,
3
- "decoder_start_token_id": 2,
4
- "eos_token_id": 2,
5
- "max_length": 200,
6
- "pad_token_id": 1,
7
  "transformers_version": "4.41.2"
8
  }
 
1
  {
2
  "bos_token_id": 0,
3
+ "max_length": 64,
4
+ "push_to_hub": true,
 
 
5
  "transformers_version": "4.41.2"
6
  }
model.safetensors CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:2fba50940f12d872863184839cd3c2e2deed6303bf87b2b107335dd6685af4bd
3
  size 2460354912
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:8ca47b26e78312487130a44744f58f15d31fc830481ef5c24608f70e39a926aa
3
  size 2460354912
runs/Jul10_18-19-37_10f2b926aa44/events.out.tfevents.1720636028.10f2b926aa44.33968.0 ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:6274d2c9a5da804e006160fa5cb322839cd28bde54af65a912086a66a0d66d40
3
+ size 395
runs/Jul10_18-28-24_10f2b926aa44/events.out.tfevents.1720636106.10f2b926aa44.33968.1 ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:8407e7d79f153797675b1f05fdcc872b6630f652f81e9d0c2d2c91e252f60afb
3
+ size 5796
runs/Jul10_18-48-05_10f2b926aa44/events.out.tfevents.1720637735.10f2b926aa44.41915.0 ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:3b4728d72b3a9297c2f785de7c126f099b10450104683ecebaa5a76a26957d56
3
+ size 395
runs/Jul10_18-56-58_10f2b926aa44/events.out.tfevents.1720637821.10f2b926aa44.41915.1 ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:dd4d702761322850b8d9893ea51e58c544f4bf94e5c761a1cf9be48deeb4683d
3
+ size 5209
runs/Jul10_19-02-20_10f2b926aa44/events.out.tfevents.1720638140.10f2b926aa44.41915.2 ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:97f277f184c35a2ee8a97ab5c69851842463d6e3d5e2e908726e54da8069c0f5
3
+ size 5795
special_tokens_map.json CHANGED
@@ -1,207 +1,6 @@
1
  {
2
  "additional_special_tokens": [
3
- "ace_Arab",
4
- "ace_Latn",
5
- "acm_Arab",
6
- "acq_Arab",
7
- "aeb_Arab",
8
- "afr_Latn",
9
- "ajp_Arab",
10
- "aka_Latn",
11
- "amh_Ethi",
12
- "apc_Arab",
13
- "arb_Arab",
14
- "ars_Arab",
15
- "ary_Arab",
16
- "arz_Arab",
17
- "asm_Beng",
18
- "ast_Latn",
19
- "awa_Deva",
20
- "ayr_Latn",
21
- "azb_Arab",
22
- "azj_Latn",
23
- "bak_Cyrl",
24
- "bam_Latn",
25
- "ban_Latn",
26
- "bel_Cyrl",
27
- "bem_Latn",
28
- "ben_Beng",
29
- "bho_Deva",
30
- "bjn_Arab",
31
- "bjn_Latn",
32
- "bod_Tibt",
33
- "bos_Latn",
34
- "bug_Latn",
35
- "bul_Cyrl",
36
- "cat_Latn",
37
- "ceb_Latn",
38
- "ces_Latn",
39
- "cjk_Latn",
40
- "ckb_Arab",
41
- "crh_Latn",
42
- "cym_Latn",
43
- "dan_Latn",
44
- "deu_Latn",
45
- "dik_Latn",
46
- "dyu_Latn",
47
- "dzo_Tibt",
48
- "ell_Grek",
49
- "eng_Latn",
50
- "epo_Latn",
51
- "est_Latn",
52
- "eus_Latn",
53
- "ewe_Latn",
54
- "fao_Latn",
55
- "pes_Arab",
56
- "fij_Latn",
57
- "fin_Latn",
58
- "fon_Latn",
59
- "fra_Latn",
60
- "fur_Latn",
61
- "fuv_Latn",
62
- "gla_Latn",
63
- "gle_Latn",
64
- "glg_Latn",
65
- "grn_Latn",
66
- "guj_Gujr",
67
- "hat_Latn",
68
- "hau_Latn",
69
- "heb_Hebr",
70
- "hin_Deva",
71
- "hne_Deva",
72
- "hrv_Latn",
73
- "hun_Latn",
74
- "hye_Armn",
75
- "ibo_Latn",
76
- "ilo_Latn",
77
- "ind_Latn",
78
- "isl_Latn",
79
- "ita_Latn",
80
- "jav_Latn",
81
- "jpn_Jpan",
82
- "kab_Latn",
83
- "kac_Latn",
84
- "kam_Latn",
85
- "kan_Knda",
86
- "kas_Arab",
87
- "kas_Deva",
88
- "kat_Geor",
89
- "knc_Arab",
90
- "knc_Latn",
91
- "kaz_Cyrl",
92
- "kbp_Latn",
93
- "kea_Latn",
94
- "khm_Khmr",
95
- "kik_Latn",
96
- "kin_Latn",
97
- "kir_Cyrl",
98
- "kmb_Latn",
99
- "kon_Latn",
100
- "kor_Hang",
101
- "kmr_Latn",
102
- "lao_Laoo",
103
- "lvs_Latn",
104
- "lij_Latn",
105
- "lim_Latn",
106
- "lin_Latn",
107
- "lit_Latn",
108
- "lmo_Latn",
109
- "ltg_Latn",
110
- "ltz_Latn",
111
- "lua_Latn",
112
- "lug_Latn",
113
- "luo_Latn",
114
- "lus_Latn",
115
- "mag_Deva",
116
- "mai_Deva",
117
- "mal_Mlym",
118
- "mar_Deva",
119
- "min_Latn",
120
- "mkd_Cyrl",
121
- "plt_Latn",
122
- "mlt_Latn",
123
- "mni_Beng",
124
- "khk_Cyrl",
125
- "mos_Latn",
126
- "mri_Latn",
127
- "zsm_Latn",
128
- "mya_Mymr",
129
- "nld_Latn",
130
- "nno_Latn",
131
- "nob_Latn",
132
- "npi_Deva",
133
- "nso_Latn",
134
- "nus_Latn",
135
- "nya_Latn",
136
- "oci_Latn",
137
- "gaz_Latn",
138
- "ory_Orya",
139
- "pag_Latn",
140
- "pan_Guru",
141
- "pap_Latn",
142
- "pol_Latn",
143
- "por_Latn",
144
- "prs_Arab",
145
- "pbt_Arab",
146
- "quy_Latn",
147
- "ron_Latn",
148
- "run_Latn",
149
- "rus_Cyrl",
150
- "sag_Latn",
151
- "san_Deva",
152
- "sat_Beng",
153
- "scn_Latn",
154
- "shn_Mymr",
155
- "sin_Sinh",
156
- "slk_Latn",
157
- "slv_Latn",
158
- "smo_Latn",
159
- "sna_Latn",
160
- "snd_Arab",
161
- "som_Latn",
162
- "sot_Latn",
163
- "spa_Latn",
164
- "als_Latn",
165
- "srd_Latn",
166
- "srp_Cyrl",
167
- "ssw_Latn",
168
- "sun_Latn",
169
- "swe_Latn",
170
- "swh_Latn",
171
- "szl_Latn",
172
- "tam_Taml",
173
- "tat_Cyrl",
174
- "tel_Telu",
175
- "tgk_Cyrl",
176
- "tgl_Latn",
177
- "tha_Thai",
178
- "tir_Ethi",
179
- "taq_Latn",
180
- "taq_Tfng",
181
- "tpi_Latn",
182
- "tsn_Latn",
183
- "tso_Latn",
184
- "tuk_Latn",
185
- "tum_Latn",
186
- "tur_Latn",
187
- "twi_Latn",
188
- "tzm_Tfng",
189
- "uig_Arab",
190
- "ukr_Cyrl",
191
- "umb_Latn",
192
- "urd_Arab",
193
- "uzn_Latn",
194
- "vec_Latn",
195
- "vie_Latn",
196
- "war_Latn",
197
- "wol_Latn",
198
- "xho_Latn",
199
- "ydd_Hebr",
200
- "yor_Latn",
201
- "yue_Hant",
202
- "zho_Hans",
203
- "zho_Hant",
204
- "zul_Latn"
205
  ],
206
  "bos_token": {
207
  "content": "<s>",
 
1
  {
2
  "additional_special_tokens": [
3
+ "btk_Latn"
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
4
  ],
5
  "bos_token": {
6
  "content": "<s>",
tokenizer.json CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:1ccbc940ccfe6d4d016b761801a30f29b4620914402d7009e7ca71dbad471012
3
- size 17331537
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:6f658ad065b13e49f915b544a65b5446be7886b70e40edc174483fcb31573214
3
+ size 17331742
tokenizer_config.json CHANGED
@@ -1655,211 +1655,18 @@
1655
  "rstrip": false,
1656
  "single_word": false,
1657
  "special": true
 
 
 
 
 
 
 
 
1658
  }
1659
  },
1660
  "additional_special_tokens": [
1661
- "ace_Arab",
1662
- "ace_Latn",
1663
- "acm_Arab",
1664
- "acq_Arab",
1665
- "aeb_Arab",
1666
- "afr_Latn",
1667
- "ajp_Arab",
1668
- "aka_Latn",
1669
- "amh_Ethi",
1670
- "apc_Arab",
1671
- "arb_Arab",
1672
- "ars_Arab",
1673
- "ary_Arab",
1674
- "arz_Arab",
1675
- "asm_Beng",
1676
- "ast_Latn",
1677
- "awa_Deva",
1678
- "ayr_Latn",
1679
- "azb_Arab",
1680
- "azj_Latn",
1681
- "bak_Cyrl",
1682
- "bam_Latn",
1683
- "ban_Latn",
1684
- "bel_Cyrl",
1685
- "bem_Latn",
1686
- "ben_Beng",
1687
- "bho_Deva",
1688
- "bjn_Arab",
1689
- "bjn_Latn",
1690
- "bod_Tibt",
1691
- "bos_Latn",
1692
- "bug_Latn",
1693
- "bul_Cyrl",
1694
- "cat_Latn",
1695
- "ceb_Latn",
1696
- "ces_Latn",
1697
- "cjk_Latn",
1698
- "ckb_Arab",
1699
- "crh_Latn",
1700
- "cym_Latn",
1701
- "dan_Latn",
1702
- "deu_Latn",
1703
- "dik_Latn",
1704
- "dyu_Latn",
1705
- "dzo_Tibt",
1706
- "ell_Grek",
1707
- "eng_Latn",
1708
- "epo_Latn",
1709
- "est_Latn",
1710
- "eus_Latn",
1711
- "ewe_Latn",
1712
- "fao_Latn",
1713
- "pes_Arab",
1714
- "fij_Latn",
1715
- "fin_Latn",
1716
- "fon_Latn",
1717
- "fra_Latn",
1718
- "fur_Latn",
1719
- "fuv_Latn",
1720
- "gla_Latn",
1721
- "gle_Latn",
1722
- "glg_Latn",
1723
- "grn_Latn",
1724
- "guj_Gujr",
1725
- "hat_Latn",
1726
- "hau_Latn",
1727
- "heb_Hebr",
1728
- "hin_Deva",
1729
- "hne_Deva",
1730
- "hrv_Latn",
1731
- "hun_Latn",
1732
- "hye_Armn",
1733
- "ibo_Latn",
1734
- "ilo_Latn",
1735
- "ind_Latn",
1736
- "isl_Latn",
1737
- "ita_Latn",
1738
- "jav_Latn",
1739
- "jpn_Jpan",
1740
- "kab_Latn",
1741
- "kac_Latn",
1742
- "kam_Latn",
1743
- "kan_Knda",
1744
- "kas_Arab",
1745
- "kas_Deva",
1746
- "kat_Geor",
1747
- "knc_Arab",
1748
- "knc_Latn",
1749
- "kaz_Cyrl",
1750
- "kbp_Latn",
1751
- "kea_Latn",
1752
- "khm_Khmr",
1753
- "kik_Latn",
1754
- "kin_Latn",
1755
- "kir_Cyrl",
1756
- "kmb_Latn",
1757
- "kon_Latn",
1758
- "kor_Hang",
1759
- "kmr_Latn",
1760
- "lao_Laoo",
1761
- "lvs_Latn",
1762
- "lij_Latn",
1763
- "lim_Latn",
1764
- "lin_Latn",
1765
- "lit_Latn",
1766
- "lmo_Latn",
1767
- "ltg_Latn",
1768
- "ltz_Latn",
1769
- "lua_Latn",
1770
- "lug_Latn",
1771
- "luo_Latn",
1772
- "lus_Latn",
1773
- "mag_Deva",
1774
- "mai_Deva",
1775
- "mal_Mlym",
1776
- "mar_Deva",
1777
- "min_Latn",
1778
- "mkd_Cyrl",
1779
- "plt_Latn",
1780
- "mlt_Latn",
1781
- "mni_Beng",
1782
- "khk_Cyrl",
1783
- "mos_Latn",
1784
- "mri_Latn",
1785
- "zsm_Latn",
1786
- "mya_Mymr",
1787
- "nld_Latn",
1788
- "nno_Latn",
1789
- "nob_Latn",
1790
- "npi_Deva",
1791
- "nso_Latn",
1792
- "nus_Latn",
1793
- "nya_Latn",
1794
- "oci_Latn",
1795
- "gaz_Latn",
1796
- "ory_Orya",
1797
- "pag_Latn",
1798
- "pan_Guru",
1799
- "pap_Latn",
1800
- "pol_Latn",
1801
- "por_Latn",
1802
- "prs_Arab",
1803
- "pbt_Arab",
1804
- "quy_Latn",
1805
- "ron_Latn",
1806
- "run_Latn",
1807
- "rus_Cyrl",
1808
- "sag_Latn",
1809
- "san_Deva",
1810
- "sat_Beng",
1811
- "scn_Latn",
1812
- "shn_Mymr",
1813
- "sin_Sinh",
1814
- "slk_Latn",
1815
- "slv_Latn",
1816
- "smo_Latn",
1817
- "sna_Latn",
1818
- "snd_Arab",
1819
- "som_Latn",
1820
- "sot_Latn",
1821
- "spa_Latn",
1822
- "als_Latn",
1823
- "srd_Latn",
1824
- "srp_Cyrl",
1825
- "ssw_Latn",
1826
- "sun_Latn",
1827
- "swe_Latn",
1828
- "swh_Latn",
1829
- "szl_Latn",
1830
- "tam_Taml",
1831
- "tat_Cyrl",
1832
- "tel_Telu",
1833
- "tgk_Cyrl",
1834
- "tgl_Latn",
1835
- "tha_Thai",
1836
- "tir_Ethi",
1837
- "taq_Latn",
1838
- "taq_Tfng",
1839
- "tpi_Latn",
1840
- "tsn_Latn",
1841
- "tso_Latn",
1842
- "tuk_Latn",
1843
- "tum_Latn",
1844
- "tur_Latn",
1845
- "twi_Latn",
1846
- "tzm_Tfng",
1847
- "uig_Arab",
1848
- "ukr_Cyrl",
1849
- "umb_Latn",
1850
- "urd_Arab",
1851
- "uzn_Latn",
1852
- "vec_Latn",
1853
- "vie_Latn",
1854
- "war_Latn",
1855
- "wol_Latn",
1856
- "xho_Latn",
1857
- "ydd_Hebr",
1858
- "yor_Latn",
1859
- "yue_Hant",
1860
- "zho_Hans",
1861
- "zho_Hant",
1862
- "zul_Latn"
1863
  ],
1864
  "bos_token": "<s>",
1865
  "clean_up_tokenization_spaces": true,
 
1655
  "rstrip": false,
1656
  "single_word": false,
1657
  "special": true
1658
+ },
1659
+ "256204": {
1660
+ "content": "btk_Latn",
1661
+ "lstrip": false,
1662
+ "normalized": false,
1663
+ "rstrip": false,
1664
+ "single_word": false,
1665
+ "special": true
1666
  }
1667
  },
1668
  "additional_special_tokens": [
1669
+ "btk_Latn"
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1670
  ],
1671
  "bos_token": "<s>",
1672
  "clean_up_tokenization_spaces": true,
training_args.bin CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:6588483e8366da0e608f755dfa56e9a541b8466b419bfa7da1bbc219043ee66f
3
  size 5240
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:cc7f095104b27ed547bec88a25cf1f2c2120fcf1de6e29eed467b1d66f0447f9
3
  size 5240