MARTINI_enrich_BERTopic_JotvingisLietuvis

This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.

Usage

To use this model, please install BERTopic:

pip install -U bertopic

You can use the model as follows:

from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_JotvingisLietuvis")

topic_model.get_topic_info()

Topic overview

  • Number of topics: 37
  • Number of training documents: 4097
Click here for an overview of all topics.
Topic ID Topic Keywords Topic Frequency Label
-1 lietuva - pasaulyje - visiskai - valdzia - europos 20 -1_lietuva_pasaulyje_visiskai_valdzia
0 palestinieciai - holokaustas - izraelyje - netanyahu - sionistai 2346 0_palestinieciai_holokaustas_izraelyje_netanyahu
1 vakcinacija - pfizer - pandemija - injekcijos - 2021 162 1_vakcinacija_pfizer_pandemija_injekcijos
2 transseksualumas - homoseksualios - transfobija - seksualizuoja - pedofilijos 161 2_transseksualumas_homoseksualios_transfobija_seksualizuoja
3 чеченцы - россииских - украина - свою - военные 104 3_чеченцы_россииских_украина_свою
4 вакцинах - доктор - ковид - видео - гидроксид 93 4_вакцинах_доктор_ковид_видео
5 muslimiskas - islamistu - musulmonu - mohammedas - alahu 92 5_muslimiskas_islamistu_musulmonu_mohammedas
6 afrikieciai - burkina - nigeriai - senegalo - prancuzijai 89 6_afrikieciai_burkina_nigeriai_senegalo
7 imigracijos - europa - atvykstanciu - fasistais - nelegaliai 66 7_imigracijos_europa_atvykstanciu_fasistais
8 susivienytikokius - melokaktai - sutrukineja - nepatvirtintas - kritikuoja 59 8_susivienytikokius_melokaktai_sutrukineja_nepatvirtintas
9 plastikas - pesticidu - toksiska - chemikalais - ekologiskais 57 9_plastikas_pesticidu_toksiska_chemikalais
10 robotas - technologijas - sexrobotai - telefonai - jutikliniai 56 10_robotas_technologijas_sexrobotai_telefonai
11 ukrainieciu - zelenskio - lietuva - ruskeliai - kijevo 53 11_ukrainieciu_zelenskio_lietuva_ruskeliai
12 tyranny - dissent - britain - protesters - fight 49 12_tyranny_dissent_britain_protesters
13 vaccine - antibodies - lymph - postmortem - causes 46 13_vaccine_antibodies_lymph_postmortem
14 bankas - euru - ukrainieciu - nuskambetu - cash 45 14_bankas_euru_ukrainieciu_nuskambetu
15 prancuzijoj - protestuotojais - macrono - kamputyje - prezidento 44 15_prancuzijoj_protestuotojais_macrono_kamputyje
16 filmuotu - spektakli - nepaaiskinama - teatre - savaitgaliui 39 16_filmuotu_spektakli_nepaaiskinama_teatre
17 globalistiniams - trumpalaikiais - kontraversija - antistablismentinius - svabiniai 38 17_globalistiniams_trumpalaikiais_kontraversija_antistablismentinius
18 skaudziausiai - prisitaikysim - siknalaiziavimui - nepastebejot - bonusinemis 31 18_skaudziausiai_prisitaikysim_siknalaiziavimui_nepastebejot
19 energijos - elektromagnetini - nikola - patentuotu - 1896 31 19_energijos_elektromagnetini_nikola_patentuotu
20 vaccinated - pfizer - deaths - omicron - published 31 20_vaccinated_pfizer_deaths_omicron
21 policijai - policininkas - nepritapeliai - prisiekusiu - pakalbeti 31 21_policijai_policininkas_nepritapeliai_prisiekusiu
22 milijonu - multimilijardierius - usd - litras - numeriai 30 22_milijonu_multimilijardierius_usd_litras
23 5g - technologija - televizoriaus - wifi - glonass 29 23_5g_technologija_televizoriaus_wifi
24 1956 - rekordininkas - saldytuvas - vamzdziai - 2000 28 24_1956_rekordininkas_saldytuvas_vamzdziai
25 elektromobiliai - baterijas - energija - autobusai - nenaudojantis 28 25_elektromobiliai_baterijas_energija_autobusai
26 co2 - greenpeace - atmosferoje - energetika - skaiciuojamas 27 26_co2_greenpeace_atmosferoje_energetika
27 ekonomikos - klausas - schwabui - globalistinems - fasistas 27 27_ekonomikos_klausas_schwabui_globalistinems
28 genetikai - transplantacijai - hibridasisivaizduojat - pasikliauja - gavimas 25 28_genetikai_transplantacijai_hibridasisivaizduojat_pasikliauja
29 archeologai - egiptieciais - skeletu - piramidziu - xviii 25 29_archeologai_egiptieciais_skeletu_piramidziu
30 konstitucijos - referendumu - teismu - susivienijimas - laisvalaikio 25 30_konstitucijos_referendumu_teismu_susivienijimas
31 farmacijos - homeopatu - praregejusiems - sukeliancios - sudafed 23 31_farmacijos_homeopatu_praregejusiems_sukeliancios
32 anglijos - naujiesiems - britanijoj - pasididziavima - marskineliai 23 32_anglijos_naujiesiems_britanijoj_pasididziavima
33 nanobotu - nanovamzdeliai - implantai - mokslininkai - 5g 22 33_nanobotu_nanovamzdeliai_implantai_mokslininkai
34 eurostat - европы - latvia - atvykeliai - belgium 21 34_eurostat_европы_latvia_atvykeliai
35 demokratijja - partijos - liberalizavima - raskeviciu - realistiskuma 21 35_demokratijja_partijos_liberalizavima_raskeviciu

Training hyperparameters

  • calculate_probabilities: True
  • language: None
  • low_memory: False
  • min_topic_size: 10
  • n_gram_range: (1, 1)
  • nr_topics: None
  • seed_topic_list: None
  • top_n_words: 10
  • verbose: False
  • zeroshot_min_similarity: 0.7
  • zeroshot_topic_list: None

Framework versions

  • Numpy: 1.26.4
  • HDBSCAN: 0.8.40
  • UMAP: 0.5.7
  • Pandas: 2.2.3
  • Scikit-Learn: 1.5.2
  • Sentence-transformers: 3.3.1
  • Transformers: 4.46.3
  • Numba: 0.60.0
  • Plotly: 5.24.1
  • Python: 3.10.12
Downloads last month
2
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.