MARTINI_enrich_BERTopic_sagciakademi

This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.

Usage

To use this model, please install BERTopic:

pip install -U bertopic

You can use the model as follows:

from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_sagciakademi")

topic_model.get_topic_info()

Topic overview

  • Number of topics: 8
  • Number of training documents: 578
Click here for an overview of all topics.
Topic ID Topic Keywords Topic Frequency Label
-1 bakanı - erdogan - ataturk - mehmet - trabzonspor 22 -1_bakanı_erdogan_ataturk_mehmet
0 istanbul - sokak - sarıyer - karsılastı - taksiciler 246 0_istanbul_sokak_sarıyer_karsılastı
1 takipcilerimiz - olmadıgını - cevabı - muslumanı - merhaba 72 1_takipcilerimiz_olmadıgını_cevabı_muslumanı
2 kılıcdaroglu - besikcioglu - buyuksehir - calısanlarımızın - camlıdere 69 2_kılıcdaroglu_besikcioglu_buyuksehir_calısanlarımızın
3 hamas - netanyahu - basbakanı - hazırlandıgını - filistinliyi 60 3_hamas_netanyahu_basbakanı_hazırlandıgını
4 teroristleri - harekatı - kuzeyindeki - irak - silah 51 4_teroristleri_harekatı_kuzeyindeki_irak
5 gururduyturkiye - hazırmısınız - noktasıydı - baslangıc - nasa 34 5_gururduyturkiye_hazırmısınız_noktasıydı_baslangıc
6 sessiz - ssss - serkan - mehmet - 30 24 6_sessiz_ssss_serkan_mehmet

Training hyperparameters

  • calculate_probabilities: True
  • language: None
  • low_memory: False
  • min_topic_size: 10
  • n_gram_range: (1, 1)
  • nr_topics: None
  • seed_topic_list: None
  • top_n_words: 10
  • verbose: False
  • zeroshot_min_similarity: 0.7
  • zeroshot_topic_list: None

Framework versions

  • Numpy: 1.26.4
  • HDBSCAN: 0.8.40
  • UMAP: 0.5.7
  • Pandas: 2.2.3
  • Scikit-Learn: 1.5.2
  • Sentence-transformers: 3.3.1
  • Transformers: 4.46.3
  • Numba: 0.60.0
  • Plotly: 5.24.1
  • Python: 3.10.12
Downloads last month
4
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.