Jerteh-81 / README.md
procesaur's picture
Update README.md
3b2c189 verified
|
raw
history blame
3.57 kB
metadata
license: cc-by-sa-4.0
datasets:
  - jerteh/cc100-sr-jerteh
  - jerteh/SrpWiki
  - jerteh/SrpELTeC
  - srwac
language:
  - sr
tags:
  - srpski
  - Serbian
  - RoBERTa
  - BERT
  - MaskedLM

jerteh-125 — BERT model specijalno obučen za srpski jezik.

Vektorizuje reči, ili dopunjava nedostajuće reči u tekstu. Jednaka podrška unosa i na ćirilici i na latinici!

Pored navedenih, model je obučavan i na ostalim korpusima Društva za jezičke resurse i tehnologije, uključujući korpuse savremenog srpskog jezika: SrpKor2013 i SrpKor2021, kao i korpus PDRS 1.0 razvijen od strane Instituta za Srpski jezik SANU.

Autor
Mihailo Škorić

U slučaju potrebe za većim modelom, pogledajte jerteh-355 — najveći BERT model za srpski jezik.

U slučaju potrebe za generativnim modelom, pogledajte gpt2-orao i gpt2-vrabac