Spaces:

phalanx80
/

SA-Dashboard

Running

App Files Files Community

phalanx80 commited on about 1 month ago

Commit

57d3dc8

verified ·

1 Parent(s): 0ba032c

Upload 3 files

Browse files

Files changed (3) hide show

app.py +75 -0
requirements.txt +4 -0
sa-dataset.csv +0 -0

app.py ADDED Viewed

	@@ -0,0 +1,75 @@

+import gradio as gr
+import pandas as pd
+import numpy as np
+import plotly.express as px
+from itertools import combinations
+from collections import Counter
+# Caricamento del dataset
+def load_data(file):
+    df = pd.read_csv(file.name)
+    df['anno_pubblicazione'] = pd.to_numeric(df['anno_pubblicazione'], errors='coerce')
+    df['num_parole'] = pd.to_numeric(df['num_parole'], errors='coerce')
+    return df
+# Funzione per calcolare la co-occorrenza delle parole chiave
+def calcola_cooccorrenza_keywords(df, top_n=30):
+    keywords_list = df['keyword'].dropna().str.split(', ')
+    all_keywords = [kw for sublist in keywords_list for kw in sublist]
+    common_keywords = Counter(all_keywords).most_common(top_n)
+    common_keywords = [kw[0] for kw in common_keywords]
+    cooccurrence = Counter()
+    for keywords in keywords_list:
+        filtered_keywords = [kw for kw in keywords if kw in common_keywords]
+        cooccurrence.update(combinations(sorted(filtered_keywords), 2))
+    co_matrix = pd.DataFrame(np.zeros((len(common_keywords), len(common_keywords))),
+                             index=common_keywords, columns=common_keywords)
+    for (kw1, kw2), count in cooccurrence.items():
+        co_matrix.loc[kw1, kw2] = count
+        co_matrix.loc[kw2, kw1] = count
+    fig = px.imshow(co_matrix, x=co_matrix.columns, y=co_matrix.index,
+                    color_continuous_scale='Blues', labels=dict(color="Co-occorrenza"),
+                    title="Mappa di Co-occorrenza delle Parole Chiave")
+    return fig
+# Funzione per calcolare il trend delle keyword
+def calcola_trend_keyword(df, top_n=10):
+    trend_df = df[['anno_pubblicazione', 'keyword']].dropna()
+    trend_df['keyword'] = trend_df['keyword'].str.split(', ')
+    trend_df = trend_df.explode('keyword')
+    keyword_counts = trend_df['keyword'].value_counts().head(top_n).index
+    trend_df = trend_df[trend_df['keyword'].isin(keyword_counts)]
+    trend_df = trend_df.groupby(['anno_pubblicazione', 'keyword']).size().reset_index(name='count')
+    fig = px.line(trend_df, x='anno_pubblicazione', y='count', color='keyword',
+                  title='Trend Temporale delle Keyword',
+                  labels={'anno_pubblicazione': 'Anno', 'count': 'Frequenza'})
+    return fig
+# Funzione per visualizzare i grafici dopo il caricamento del file
+def visualizza_grafici(file):
+    df = load_data(file)
+    fig1 = calcola_cooccorrenza_keywords(df)
+    fig2 = calcola_trend_keyword(df)
+    return fig1, fig2
+# Creazione dell'interfaccia Gradio
+with gr.Blocks() as app:
+    gr.Markdown("## Dashboard per l'Analisi dei Dati degli Articoli di Storia dell'Arte")
+    file_input = gr.File(label="Carica il file CSV con i dati")
+    output1 = gr.Plot(label="Mappa di Co-occorrenza delle Parole Chiave")
+    output2 = gr.Plot(label="Trend Temporale delle Keyword")
+    btn = gr.Button("Analizza")
+    btn.click(visualizza_grafici, inputs=file_input, outputs=[output1, output2])
+# Avvio dell'interfaccia
+if __name__ == "__main__":
+    app.launch()

requirements.txt ADDED Viewed

	@@ -0,0 +1,4 @@

+gradio
+pandas
+numpy
+plotly

sa-dataset.csv ADDED Viewed

The diff for this file is too large to render. See raw diff