Unbabel
/

wmt20-comet-da

Translation

arXiv:2010.15535

PyTorch

Model card Files Files and versions Community

Ubuntu commited on Feb 11, 2023

Commit

840e204

2 Parent(s): bba257f 460c3b9

Merge branch 'main' of https://huggingface.co/Unbabel/wmt20-comet-da into main

Browse files

Files changed (1) hide show

README.md +105 -98

README.md CHANGED Viewed

@@ -1,101 +1,104 @@
 ---
 pipeline_tag: translation
 language:
-  - multilingual
-  - af
-  - am
-  - ar
-  - as
-  - az
-  - be
-  - bg
-  - bn
-  - br
-  - bs
-  - ca
-  - cs
-  - cy
-  - da
-  - de
-  - el
-  - en
-  - eo
-  - es
-  - et
-  - eu
-  - fa
-  - fi
-  - fr
-  - fy
-  - ga
-  - gd
-  - gl
-  - gu
-  - ha
-  - he
-  - hi
-  - hr
-  - hu
-  - hy
-  - id
-  - is
-  - it
-  - ja
-  - jv
-  - ka
-  - kk
-  - km
-  - kn
-  - ko
-  - ku
-  - ky
-  - la
-  - lo
-  - lt
-  - lv
-  - mg
-  - mk
-  - ml
-  - mn
-  - mr
-  - ms
-  - my
-  - ne
-  - nl
-  - 'no'
-  - om
-  - or
-  - pa
-  - pl
-  - ps
-  - pt
-  - ro
-  - ru
-  - sa
-  - sd
-  - si
-  - sk
-  - sl
-  - so
-  - sq
-  - sr
-  - su
-  - sv
-  - sw
-  - ta
-  - te
-  - th
-  - tl
-  - tr
-  - ug
-  - uk
-  - ur
-  - uz
-  - vi
-  - xh
-  - yi
-  - zh
 license: apache-2.0
 ---
 This is a [COMET](https://github.com/Unbabel/COMET) evaluation model: It receives a triplet with (source sentence, translation, reference translation) and returns a score that reflects the quality of the translation compared to both source and reference.
@@ -106,7 +109,11 @@ This is a [COMET](https://github.com/Unbabel/COMET) evaluation model: It receive
 [Unbabel’s Participation in the WMT20 Metrics Shared Task](https://aclanthology.org/2020.wmt-1.101) (Rei et al., WMT 2020)
-## Usage (unbabel-comet)
 Using this model requires unbabel-comet to be installed:
@@ -138,16 +145,16 @@ model_output = model.predict(data, batch_size=8, gpus=1)
 print (model_output)
 ```
-## Intended uses
 Our model is intented to be used for **MT evaluation**.
 Given a a triplet with (source sentence, translation, reference translation) outputs a single score. This score is unbounded but typically falls between -1 and 1 where 1 reflects a perfect translation.
-## Languages Covered:
 This model builds on top of XLM-R which cover the following languages:
 Afrikaans, Albanian, Amharic, Arabic, Armenian, Assamese, Azerbaijani, Basque, Belarusian, Bengali, Bengali Romanized, Bosnian, Breton, Bulgarian, Burmese, Burmese, Catalan, Chinese (Simplified), Chinese (Traditional), Croatian, Czech, Danish, Dutch, English, Esperanto, Estonian, Filipino, Finnish, French, Galician, Georgian, German, Greek, Gujarati, Hausa, Hebrew, Hindi, Hindi Romanized, Hungarian, Icelandic, Indonesian, Irish, Italian, Japanese, Javanese, Kannada, Kazakh, Khmer, Korean, Kurdish (Kurmanji), Kyrgyz, Lao, Latin, Latvian, Lithuanian, Macedonian, Malagasy, Malay, Malayalam, Marathi, Mongolian, Nepali, Norwegian, Oriya, Oromo, Pashto, Persian, Polish, Portuguese, Punjabi, Romanian, Russian, Sanskri, Scottish, Gaelic, Serbian, Sindhi, Sinhala, Slovak, Slovenian, Somali, Spanish, Sundanese, Swahili, Swedish, Tamil, Tamil Romanized, Telugu, Telugu Romanized, Thai, Turkish, Ukrainian, Urdu, Urdu Romanized, Uyghur, Uzbek, Vietnamese, Welsh, Western, Frisian, Xhosa, Yiddish.
-Thus, results for language pairs containing uncovered languages are unreliable!

 ---
 pipeline_tag: translation
 language:
+- multilingual
+- af
+- am
+- ar
+- as
+- az
+- be
+- bg
+- bn
+- br
+- bs
+- ca
+- cs
+- cy
+- da
+- de
+- el
+- en
+- eo
+- es
+- et
+- eu
+- fa
+- fi
+- fr
+- fy
+- ga
+- gd
+- gl
+- gu
+- ha
+- he
+- hi
+- hr
+- hu
+- hy
+- id
+- is
+- it
+- ja
+- jv
+- ka
+- kk
+- km
+- kn
+- ko
+- ku
+- ky
+- la
+- lo
+- lt
+- lv
+- mg
+- mk
+- ml
+- mn
+- mr
+- ms
+- my
+- ne
+- nl
+- 'no'
+- om
+- or
+- pa
+- pl
+- ps
+- pt
+- ro
+- ru
+- sa
+- sd
+- si
+- sk
+- sl
+- so
+- sq
+- sr
+- su
+- sv
+- sw
+- ta
+- te
+- th
+- tl
+- tr
+- ug
+- uk
+- ur
+- uz
+- vi
+- xh
+- yi
+- zh
 license: apache-2.0
+tags:
+- arXiv:2010.15535
+- PyTorch
 ---
 This is a [COMET](https://github.com/Unbabel/COMET) evaluation model: It receives a triplet with (source sentence, translation, reference translation) and returns a score that reflects the quality of the translation compared to both source and reference.
 [Unbabel’s Participation in the WMT20 Metrics Shared Task](https://aclanthology.org/2020.wmt-1.101) (Rei et al., WMT 2020)
+# License
+Apache-2.0
+# Usage (unbabel-comet)
 Using this model requires unbabel-comet to be installed:
 print (model_output)
 ```
+# Intended uses
 Our model is intented to be used for **MT evaluation**.
 Given a a triplet with (source sentence, translation, reference translation) outputs a single score. This score is unbounded but typically falls between -1 and 1 where 1 reflects a perfect translation.
+# Languages Covered:
 This model builds on top of XLM-R which cover the following languages:
 Afrikaans, Albanian, Amharic, Arabic, Armenian, Assamese, Azerbaijani, Basque, Belarusian, Bengali, Bengali Romanized, Bosnian, Breton, Bulgarian, Burmese, Burmese, Catalan, Chinese (Simplified), Chinese (Traditional), Croatian, Czech, Danish, Dutch, English, Esperanto, Estonian, Filipino, Finnish, French, Galician, Georgian, German, Greek, Gujarati, Hausa, Hebrew, Hindi, Hindi Romanized, Hungarian, Icelandic, Indonesian, Irish, Italian, Japanese, Javanese, Kannada, Kazakh, Khmer, Korean, Kurdish (Kurmanji), Kyrgyz, Lao, Latin, Latvian, Lithuanian, Macedonian, Malagasy, Malay, Malayalam, Marathi, Mongolian, Nepali, Norwegian, Oriya, Oromo, Pashto, Persian, Polish, Portuguese, Punjabi, Romanian, Russian, Sanskri, Scottish, Gaelic, Serbian, Sindhi, Sinhala, Slovak, Slovenian, Somali, Spanish, Sundanese, Swahili, Swedish, Tamil, Tamil Romanized, Telugu, Telugu Romanized, Thai, Turkish, Ukrainian, Urdu, Urdu Romanized, Uyghur, Uzbek, Vietnamese, Welsh, Western, Frisian, Xhosa, Yiddish.
+Thus, results for language pairs containing uncovered languages are unreliable!