Spaces:

Rozeeeee
/

evo

Sleeping

App Files Files Community

Rozeeeee commited on Jan 29

Commit

f0d8947

verified ·

1 Parent(s): 615048a

Update app.py

Browse files

Files changed (1) hide show

app.py +82 -53

app.py CHANGED Viewed

@@ -1,75 +1,104 @@
 import streamlit as st
 import pandas as pd
-import numpy as np
 import requests
-import io
 import plotly.express as px
-# 下載 CSV 數據
 def download_and_load_csv(url):
     response = requests.get(url)
     response.encoding = 'utf-8'
     df = pd.read_csv(io.StringIO(response.text), encoding='utf-8')
-    # 清理欄位名稱
-    df.columns = df.columns.str.strip().str.replace("\n", "").str.replace("\r", "")
     return df
-# 清理數據並合併
-def clean_and_merge_data(urls):
-    dfs = [download_and_load_csv(url) for url in urls]
-    combined_df = pd.concat(dfs, ignore_index=True)
-    # 指定要清理的排放量欄位
-    emission_columns = ["範疇一排放量(噸CO2e)", "範疇二排放量(噸CO2e)", "範疇三排放量(噸CO2e)"]
-    # 確保所有欄位名稱都乾淨
-    combined_df.columns = combined_df.columns.str.strip().str.replace("\n", "").str.replace("\r", "")
-    # 檢查是否有缺失欄位
-    missing_columns = [col for col in emission_columns if col not in combined_df.columns]
-    if missing_columns:
-        st.write(f"❌ 找不到這些欄位: {missing_columns}")
-        return combined_df  # 直接返回原始數據，避免程式崩潰
-    # 只清理 emission_columns 內的 0 值，不影響其他欄位
-    combined_df[emission_columns] = combined_df[emission_columns].replace(0, np.nan).dropna(subset=emission_columns)
-    # 依據 "公司名稱" 進行合併，將相同公司名稱的數據進行加總
-    merged_df = combined_df.groupby("公司名稱", as_index=False).sum()
-    # 刪除包含 NaN 的列
-    merged_df = merged_df.dropna()
-    return merged_df
-# CSV 來源
 urls = [
     "https://mopsfin.twse.com.tw/opendata/t187ap46_L_1.csv",
     "https://mopsfin.twse.com.tw/opendata/t187ap46_O_2.csv",
     "https://mopsfin.twse.com.tw/opendata/t187ap46_L_6.csv"
 ]
-# 清理並合併數據
-cleaned_df = clean_and_merge_data(urls)
-# 設置 Streamlit 標題
-st.title("台灣企業 ESG 數據分析與揭露")
-# 顯示清理後的數據
-st.subheader("清理 & 合併後的數據預覽")
-st.dataframe(cleaned_df)
-# 繪製動態圖表
-st.subheader("ESG 排放量動態圖表")
-# 合併三個範疇的排放量數據，並將其轉換為長格式
-emission_df = cleaned_df.melt(id_vars=["公���名稱"], value_vars=["範疇一排放量(噸CO2e)", "範疇二排放量(噸CO2e)", "範疇三排放量(噸CO2e)"],
-                              var_name="排放範疇", value_name="排放量")
-# 使用 Plotly 繪製動態柱狀圖
-fig = px.bar(emission_df, x="公司名稱", y="排放量", color="排放範疇", title="各公司 ESG 排放量",
-             labels={"排放量": "排放量 (噸CO2e)", "公司名稱": "公司名稱", "排放範疇": "排放範疇"})
-# 顯示圖表
-st.plotly_chart(fig)

 import streamlit as st
 import pandas as pd
 import requests
 import plotly.express as px
+import plotly.graph_objects as go
+import io
+# 設置全局主題 - 使用更豐富的彩色主題
+theme = px.colors.qualitative.Bold
+# Function to download and load CSV data
 def download_and_load_csv(url):
     response = requests.get(url)
     response.encoding = 'utf-8'
     df = pd.read_csv(io.StringIO(response.text), encoding='utf-8')
+    df = df.fillna(1)  # Replace all 0 with 1
     return df
+# 美化函數
+def beautify_chart(fig):
+    fig.update_layout(
+        font_family="Arial",
+        font_color="#444",
+        title_font_family="Arial",
+        title_font_color="#000",
+        legend_title_font_color="#000",
+        plot_bgcolor='rgba(0,0,0,0)',
+        paper_bgcolor='rgba(0,0,0,0)',
+    )
+    fig.update_xaxes(showline=True, linewidth=2, linecolor='lightgray', gridcolor='lightgray')
+    fig.update_yaxes(showline=True, linewidth=2, linecolor='lightgray', gridcolor='lightgray')
+    return fig
+# 通用函數來生成並顯示圖表
+def generate_plots(df, df_name, selected_columns):
+    selected_columns = list(selected_columns)  # 將 Index 轉換為列表
+    if not selected_columns:
+        st.write(f"{df_name} 中沒有找到可用的數值列來繪製圖表")
+        return
+    with st.expander(f"顯示/隱藏 {df_name} 圖表"):
+        st.subheader(f"{df_name} 線圖")
+        fig_line = px.line(df, x="公司名稱", y=selected_columns, title=f"{df_name} 線圖", color_discrete_sequence=theme)
+        fig_line = beautify_chart(fig_line)
+        st.plotly_chart(fig_line)
+        st.subheader(f"{df_name} 餅圖")
+        # 分組並計算總排放量
+        total_emissions = df.groupby("公司名稱")[selected_columns].sum().reset_index()
+        total_emissions = total_emissions.melt(id_vars=["公司名稱"], value_vars=selected_columns, var_name="Emission Type", value_name="Total Emissions")
+        # 創建餅圖
+        fig_pie = px.pie(total_emissions, values='Total Emissions', names='公司名稱',
+                         title=f"{df_name} 各公司排放量的餅圖",
+                         color_discrete_sequence=theme, hole=0.3)
+        fig_pie.update_traces(textposition='inside', textinfo='percent+label')
+        fig_pie = beautify_chart(fig_pie)
+        st.plotly_chart(fig_pie)
+        if len(selected_columns) >= 2:
+            st.subheader(f"{df_name} 散點圖")
+            fig_scatter = px.scatter(df, x="公司名稱", y=selected_columns,
+                                     title=f"{df_name} 散點圖", color_discrete_sequence=theme)
+            fig_scatter = beautify_chart(fig_scatter)
+            st.plotly_chart(fig_scatter)
+# URLs for the CSV files
 urls = [
     "https://mopsfin.twse.com.tw/opendata/t187ap46_L_1.csv",
     "https://mopsfin.twse.com.tw/opendata/t187ap46_O_2.csv",
     "https://mopsfin.twse.com.tw/opendata/t187ap46_L_6.csv"
 ]
+# Download, load, and clean data from each CSV file
+dfs = [download_and_load_csv(url) for url in urls]
+# Combine all DataFrames into one
+combined_df = pd.concat(dfs, ignore_index=True)
+# Set up the Streamlit app
+st.title("台灣企業ESG數據分析與揭露")
+# Display the combined DataFrame
+st.subheader("爬取的資料預覽")
+st.dataframe(combined_df)
+# Specify the columns related to emissions
+emission_columns = [
+    "範疇一排放量(噸CO2e)",
+    "範疇二排放量(噸CO2e)",
+    "範疇三排放量(噸CO2e)"
+]
+# Create buttons for each emission category
+selected_columns = []
+for column in emission_columns:
+    if st.button(f"顯示 {column}"):
+        selected_columns.append(column)
+# Generate plots for the selected emission categories
+if selected_columns:
+    generate_plots(combined_df, "Combined Data", selected_columns)
+else:
+    st.write("請選擇至少一個排放類別來顯示圖表。")