Spaces:

nielsr
/

community-science-progress

Sleeping

App Files Files Community

nielsr HF Staff commited on Jul 21, 2024

Commit

570845b

1 Parent(s): 57c87c9

Big improvements to simplify code

Browse files

Files changed (1) hide show

app.py +68 -56

app.py CHANGED Viewed

@@ -10,62 +10,74 @@ import pandas as pd
 def main():
     st.title("Hugging Face Papers KPI Dashboard")
-    # TODO use this instead
-    # df = get_data()
-    df = pd.read_csv('/Users/nielsrogge/Downloads/daily_papers_enriched (1).csv')
-    df = df.drop(['Unnamed: 0'], axis=1)
-    # Use date as index
-    # Note that it's a string, not a datetime
-    df = df.set_index('date')
-    df.index = pd.to_datetime(df.index).strftime('%d-%m-%Y')
-    df = df.sort_index()
-    # Button to select day, month or week
-    # Add streamlit selectbox.
-    view_level = st.selectbox(label="View data per day, week or month", options=["day", "week", "month"])
-    if view_level == "day":
-        # make a button to select the day, defaulting to today
-        day = st.date_input("Select day", value="today", format="DD/MM/YYYY")
-        # convert to the day of a Pandas Timestamp
-        day = pd.Timestamp(day)
-        print("Day:", day)
-        df = df.loc[day.strftime('%d-%m-%Y'):day.strftime('%d-%m-%Y')]
-        st.write(f"Showing data for {day.strftime('%d/%m/%Y')}")
-        st.markdown(f"""
-        ## Number of papers: {df.shape[0]}
-        #### Number of papers with a Github link: {df['github'].notnull().sum()}
-        #### Number of papers with at least one HF artifact: {df['num_models'].sum()}
-        """)
-        st.dataframe(df,
-                     hide_index=True,
-                     column_order=("paper_page", "title", "github", "num_models", "num_datasets", "num_spaces"),
-                     column_config={"github": st.column_config.LinkColumn(),
-                                    "paper_page": st.column_config.LinkColumn()},
-                    width=2000)
-    elif view_level == "week":
-        # make a button to select the week
-        week = st.sidebar.date_input("Select week", value=pd.Timestamp.today().isocalendar())
-        df = df.loc[df['date'].dt.isocalendar().week == week.isocalendar().week]
-        st.write(f"Showing data for {day}")
-        st.dataframe(df)
-    elif view_level == "month":
-        # make a button to select the month, defaulting to current month
-        month = st.sidebar.date_input("Select month", value=pd.Timestamp.today().month_name())
-        df = df.loc[df['date'].dt.month_name() == month]
-        st.write(f"Showing data for {day}")
-        st.dataframe(df)
     # Display data based on aggregation level

 def main():
     st.title("Hugging Face Papers KPI Dashboard")
+    # 2 tabs: one for daily data, one for weekly data
+    st.sidebar.title("Navigation")
+    selection = st.sidebar.selectbox("Go to", ["Daily/weekly/monthly data", "Aggregated data"])
+    if selection == "Daily/weekly/monthly data":
+        # TODO use this instead
+        # df = get_data()
+        df = pd.read_csv('/Users/nielsrogge/Downloads/daily_papers_enriched (1).csv')
+        df = df.drop(['Unnamed: 0'], axis=1)
+        # Use date as index
+        df = df.set_index('date')
+        df.index = pd.to_datetime(df.index)
+        df = df.sort_index()
+        # Button to select day, month or week
+        # Add streamlit selectbox.
+        view_level = st.selectbox(label="View data per day, week or month", options=["day", "week", "month"])
+        if view_level == "day":
+            # make a button to select the day, defaulting to today
+            day = st.date_input("Select day", value="today", format="DD/MM/YYYY")
+            # convert to the day of a Pandas Timestamp
+            day = pd.Timestamp(day)
+            print("Day:", day)
+            df = df[df.index.date == day.date()]
+            st.write(f"Showing data for {day.strftime('%d/%m/%Y')}")
+            num_artifacts = df[(df['num_models'] > 0) | (df['num_datasets'] > 0) | (df['num_spaces'] > 0)].shape[0]
+            st.markdown(f"""
+            ## Number of papers: {df.shape[0]}
+            #### Number of papers with a Github link: {df['github'].notnull().sum()}
+            #### Number of papers with at least one HF artifact: {num_artifacts}
+            """)
+            st.dataframe(df,
+                        hide_index=True,
+                        column_order=("paper_page", "title", "github", "num_models", "num_datasets", "num_spaces"),
+                        column_config={"github": st.column_config.LinkColumn(),
+                                        "paper_page": st.column_config.LinkColumn()},
+                        width=2000)
+        elif view_level == "week":
+            # make a button to select the week
+            week = st.number_input("Select week", value=datetime.today().isocalendar()[1], min_value=1, max_value=52)
+            df = df.loc[df['date'].dt.isocalendar().week == week.isocalendar().week]
+            st.write(f"Showing data for {day}")
+            st.dataframe(df)
+        elif view_level == "month":
+            # make a button to select the month, defaulting to current month
+            month = st.sidebar.date_input("Select month", value=pd.Timestamp.today().month_name())
+            df = df.loc[df['date'].dt.month_name() == month]
+            st.write(f"Showing data for {day}")
+            st.dataframe(df)
+    elif selection == "Aggregated data":
+        st.write("Aggregated data")
+    else:
+        st.write("Error: selection not recognized")
     # Display data based on aggregation level