--- license: cc-by-sa-4.0 datasets: - jerteh/cc100-sr-jerteh - jerteh/SrpWiki - jerteh/SrpELTeC - srwac language: - sr tags: - srpski - Serbian - RoBERTa - BERT - MaskedLM ---

jerteh-125 — BERT model specijalno obučen za srpski jezik.

Vektorizuje reči, ili dopunjava nedostajuće reči u tekstu. Jednaka podrška unosa i na ćirilici i na latinici! Pored navedenih, model je obučavan i na ostalim korpusima [Društva za jezičke resurse i tehnologije](https://jerteh.rs), uključujući korpuse savremenog srpskog jezika: SrpKor2013 i SrpKor2021, kao i korpus [PDRS 1.0](https://www.clarin.si/repository/xmlui/handle/11356/1752) razvijen od strane Instituta za Srpski jezik SANU.
Autor
Mihailo Škorić
@procesaur

U slučaju potrebe za većim modelom, pogledajte jerteh-355 — najveći BERT model za srpski jezik.

U slučaju potrebe za generativnim modelom, pogledajte gpt2-orao i gpt2-vrabac