MARTINI_enrich_BERTopic_ulusaleksen

This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.

Usage

To use this model, please install BERTopic:

pip install -U bertopic

You can use the model as follows:

from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_ulusaleksen")

topic_model.get_topic_info()

Topic overview

  • Number of topics: 17
  • Number of training documents: 2554
Click here for an overview of all topics.
Topic ID Topic Keywords Topic Frequency Label
-1 kılıcdaroglu - bakanı - erdogan - istanbul - imamoglu 20 -1_kılıcdaroglu_bakanı_erdogan_istanbul
0 maskesiz - enfeksiyonları - maskeyi - yası - viransehir 1577 0_maskesiz_enfeksiyonları_maskeyi_yası
1 bankası - turkiye - fiyatları - lirası - yılın 104 1_bankası_turkiye_fiyatları_lirası
2 doktorlar - sirketlerinin - folik - kemoterapi - yapılamaz 104 2_doktorlar_sirketlerinin_folik_kemoterapi
3 transhumanizmin - insanlıgın - filmleri - vizyonu - teknolojik 98 3_transhumanizmin_insanlıgın_filmleri_vizyonu
4 anlamsız - biliyorsunuz - hayatında - sakallı - merhametli 94 4_anlamsız_biliyorsunuz_hayatında_sakallı
5 koronavirusten - kovid - pandemi - remdesivir - asısız 84 5_koronavirusten_kovid_pandemi_remdesivir
6 buyuksehir - cumhurbaskanlıgı - sarayların - belediyesi - pazarlık 77 6_buyuksehir_cumhurbaskanlıgı_sarayların_belediyesi
7 viruslerin - covid - coronagercegi - calısıyorlar - sars 71 7_viruslerin_covid_coronagercegi_calısıyorlar
8 pfizer - bilimcilerin - mrna - asısının - genetigimizi 61 8_pfizer_bilimcilerin_mrna_asısının
9 pcr - testleri - pandemi - 5gvirusnews - olabilirler 54 9_pcr_testleri_pandemi_5gvirusnews
10 ergenekoncuların - hizbullah - teroristler - kayseri - kaptanı 48 10_ergenekoncuların_hizbullah_teroristler_kayseri
11 hayvanların - sokaklardan - cocuklar - kopeklerinin - kızı 41 11_hayvanların_sokaklardan_cocuklar_kopeklerinin
12 islamcılar - allahın - fatiha - hakim - murat 40 12_islamcılar_allahın_fatiha_hakim
13 numaralı - diyarbakır - sanlıurfa - imzalatıldı - karaosmanoglu 29 13_numaralı_diyarbakır_sanlıurfa_imzalatıldı
14 bakanı - cumhuriyet - serkan - ifsaları - taskesenlioglu 29 14_bakanı_cumhuriyet_serkan_ifsaları
15 uyandırmamız - taraftarıyım - kararımızı - partisi - destekliyor 23 15_uyandırmamız_taraftarıyım_kararımızı_partisi

Training hyperparameters

  • calculate_probabilities: True
  • language: None
  • low_memory: False
  • min_topic_size: 10
  • n_gram_range: (1, 1)
  • nr_topics: None
  • seed_topic_list: None
  • top_n_words: 10
  • verbose: False
  • zeroshot_min_similarity: 0.7
  • zeroshot_topic_list: None

Framework versions

  • Numpy: 1.26.4
  • HDBSCAN: 0.8.40
  • UMAP: 0.5.7
  • Pandas: 2.2.3
  • Scikit-Learn: 1.5.2
  • Sentence-transformers: 3.3.1
  • Transformers: 4.46.3
  • Numba: 0.60.0
  • Plotly: 5.24.1
  • Python: 3.10.12
Downloads last month
4
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.