File size: 6,111 Bytes
333e312
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107

---
tags:
- bertopic
library_name: bertopic
pipeline_tag: text-classification
---

# MARTINI_enrich_BERTopic_JotvingisLietuvis

This is a [BERTopic](https://github.com/MaartenGr/BERTopic) model. 
BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets. 

## Usage 

To use this model, please install BERTopic:

```
pip install -U bertopic
```

You can use the model as follows:

```python
from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_JotvingisLietuvis")

topic_model.get_topic_info()
```

## Topic overview

* Number of topics: 37
* Number of training documents: 4097

<details>
  <summary>Click here for an overview of all topics.</summary>
  
  | Topic ID | Topic Keywords | Topic Frequency | Label | 
|----------|----------------|-----------------|-------| 
| -1 | lietuva - pasaulyje - visiskai - valdzia - europos | 20 | -1_lietuva_pasaulyje_visiskai_valdzia | 
| 0 | palestinieciai - holokaustas - izraelyje - netanyahu - sionistai | 2346 | 0_palestinieciai_holokaustas_izraelyje_netanyahu | 
| 1 | vakcinacija - pfizer - pandemija - injekcijos - 2021 | 162 | 1_vakcinacija_pfizer_pandemija_injekcijos | 
| 2 | transseksualumas - homoseksualios - transfobija - seksualizuoja - pedofilijos | 161 | 2_transseksualumas_homoseksualios_transfobija_seksualizuoja | 
| 3 | чеченцы - россииских - украина - свою - военные | 104 | 3_чеченцы_россииских_украина_свою | 
| 4 | вакцинах - доктор - ковид - видео - гидроксид | 93 | 4_вакцинах_доктор_ковид_видео | 
| 5 | muslimiskas - islamistu - musulmonu - mohammedas - alahu | 92 | 5_muslimiskas_islamistu_musulmonu_mohammedas | 
| 6 | afrikieciai - burkina - nigeriai - senegalo - prancuzijai | 89 | 6_afrikieciai_burkina_nigeriai_senegalo | 
| 7 | imigracijos - europa - atvykstanciu - fasistais - nelegaliai | 66 | 7_imigracijos_europa_atvykstanciu_fasistais | 
| 8 | susivienytikokius - melokaktai - sutrukineja - nepatvirtintas - kritikuoja | 59 | 8_susivienytikokius_melokaktai_sutrukineja_nepatvirtintas | 
| 9 | plastikas - pesticidu - toksiska - chemikalais - ekologiskais | 57 | 9_plastikas_pesticidu_toksiska_chemikalais | 
| 10 | robotas - technologijas - sexrobotai - telefonai - jutikliniai | 56 | 10_robotas_technologijas_sexrobotai_telefonai | 
| 11 | ukrainieciu - zelenskio - lietuva - ruskeliai - kijevo | 53 | 11_ukrainieciu_zelenskio_lietuva_ruskeliai | 
| 12 | tyranny - dissent - britain - protesters - fight | 49 | 12_tyranny_dissent_britain_protesters | 
| 13 | vaccine - antibodies - lymph - postmortem - causes | 46 | 13_vaccine_antibodies_lymph_postmortem | 
| 14 | bankas - euru - ukrainieciu - nuskambetu - cash | 45 | 14_bankas_euru_ukrainieciu_nuskambetu | 
| 15 | prancuzijoj - protestuotojais - macrono - kamputyje - prezidento | 44 | 15_prancuzijoj_protestuotojais_macrono_kamputyje | 
| 16 | filmuotu - spektakli - nepaaiskinama - teatre - savaitgaliui | 39 | 16_filmuotu_spektakli_nepaaiskinama_teatre | 
| 17 | globalistiniams - trumpalaikiais - kontraversija - antistablismentinius - svabiniai | 38 | 17_globalistiniams_trumpalaikiais_kontraversija_antistablismentinius | 
| 18 | skaudziausiai - prisitaikysim - siknalaiziavimui - nepastebejot - bonusinemis | 31 | 18_skaudziausiai_prisitaikysim_siknalaiziavimui_nepastebejot | 
| 19 | energijos - elektromagnetini - nikola - patentuotu - 1896 | 31 | 19_energijos_elektromagnetini_nikola_patentuotu | 
| 20 | vaccinated - pfizer - deaths - omicron - published | 31 | 20_vaccinated_pfizer_deaths_omicron | 
| 21 | policijai - policininkas - nepritapeliai - prisiekusiu - pakalbeti | 31 | 21_policijai_policininkas_nepritapeliai_prisiekusiu | 
| 22 | milijonu - multimilijardierius - usd - litras - numeriai | 30 | 22_milijonu_multimilijardierius_usd_litras | 
| 23 | 5g - technologija - televizoriaus - wifi - glonass | 29 | 23_5g_technologija_televizoriaus_wifi | 
| 24 | 1956 - rekordininkas - saldytuvas - vamzdziai - 2000 | 28 | 24_1956_rekordininkas_saldytuvas_vamzdziai | 
| 25 | elektromobiliai - baterijas - energija - autobusai - nenaudojantis | 28 | 25_elektromobiliai_baterijas_energija_autobusai | 
| 26 | co2 - greenpeace - atmosferoje - energetika - skaiciuojamas | 27 | 26_co2_greenpeace_atmosferoje_energetika | 
| 27 | ekonomikos - klausas - schwabui - globalistinems - fasistas | 27 | 27_ekonomikos_klausas_schwabui_globalistinems | 
| 28 | genetikai - transplantacijai - hibridasisivaizduojat - pasikliauja - gavimas | 25 | 28_genetikai_transplantacijai_hibridasisivaizduojat_pasikliauja | 
| 29 | archeologai - egiptieciais - skeletu - piramidziu - xviii | 25 | 29_archeologai_egiptieciais_skeletu_piramidziu | 
| 30 | konstitucijos - referendumu - teismu - susivienijimas - laisvalaikio | 25 | 30_konstitucijos_referendumu_teismu_susivienijimas | 
| 31 | farmacijos - homeopatu - praregejusiems - sukeliancios - sudafed | 23 | 31_farmacijos_homeopatu_praregejusiems_sukeliancios | 
| 32 | anglijos - naujiesiems - britanijoj - pasididziavima - marskineliai | 23 | 32_anglijos_naujiesiems_britanijoj_pasididziavima | 
| 33 | nanobotu - nanovamzdeliai - implantai - mokslininkai - 5g | 22 | 33_nanobotu_nanovamzdeliai_implantai_mokslininkai | 
| 34 | eurostat - европы - latvia - atvykeliai - belgium | 21 | 34_eurostat_европы_latvia_atvykeliai | 
| 35 | demokratijja - partijos - liberalizavima - raskeviciu - realistiskuma | 21 | 35_demokratijja_partijos_liberalizavima_raskeviciu |
  
</details>

## Training hyperparameters

* calculate_probabilities: True
* language: None
* low_memory: False
* min_topic_size: 10
* n_gram_range: (1, 1)
* nr_topics: None
* seed_topic_list: None
* top_n_words: 10
* verbose: False
* zeroshot_min_similarity: 0.7
* zeroshot_topic_list: None

## Framework versions

* Numpy: 1.26.4
* HDBSCAN: 0.8.40
* UMAP: 0.5.7
* Pandas: 2.2.3
* Scikit-Learn: 1.5.2
* Sentence-transformers: 3.3.1
* Transformers: 4.46.3
* Numba: 0.60.0
* Plotly: 5.24.1
* Python: 3.10.12