Files changed (1) hide show
  1. app.py +94 -96
app.py CHANGED
@@ -2,113 +2,111 @@ import streamlit as st
2
  import pandas as pd
3
  import requests
4
  import plotly.express as px
5
- import matplotlib.font_manager as fm
6
- import matplotlib as mpl
7
  import io
8
- import time
9
 
10
- # 確保正確的中文字符編碼
11
- st.set_page_config(page_title="🌳台灣中小企業ESG數據分析與揭露儀錶板🌲", page_icon=":chart_with_upwards_trend:", layout="wide")
12
 
13
- # 定義 URL
14
- urls = {
15
- "溫室氣體": "https://mopsfin.twse.com.tw/opendata/t187ap46_L_1.csv",
16
- "能源": "https://mopsfin.twse.com.tw/opendata/t187ap46_O_2.csv",
17
- "董事會揭露": "https://mopsfin.twse.com.tw/opendata/t187ap46_L_6.csv"
18
- }
19
-
20
- # 下載並加載 CSV 文件到 DataFrame 的函數
21
- @st.cache_data
22
- def load_data(url):
23
  response = requests.get(url)
24
  response.encoding = 'utf-8'
25
  df = pd.read_csv(io.StringIO(response.text), encoding='utf-8')
26
- df = df.fillna(0)
27
  return df
28
 
29
- # Streamlit 應用
30
- st.title("台灣企業ESG數據分析與揭露")
31
- st.subheader("以溫室氣體 X 再生能源 X 董事會資訊: https://www.tejwin.com/insight/carbon-footprint-verification/")
32
- st.subheader("ESG投資: https://www.fhtrust.com.tw/ESG/operating")
33
-
34
- # 允許用戶選擇數據集
35
- dataset_choice = st.selectbox("選擇要顯示的數據集", list(urls.keys()))
36
-
37
- # 加載選定的數據集
38
- selected_df = load_data(urls[dataset_choice])
 
 
 
 
39
 
40
- # 顯示爬取的資料
41
- st.write("### 爬取的資料預覽")
42
- st.dataframe(selected_df.head())
43
 
44
- # 過濾出數值類型的列,排除 '出表日期' 和 '報告年度'
45
- numeric_columns = selected_df.select_dtypes(include=['float64', 'int64']).columns
46
- numeric_columns = [col for col in numeric_columns if col not in ['出表日期', '報告年度']]
47
-
48
- # 允許用戶選擇用於繪製圖表的列
49
- column_choice = st.selectbox("選擇欄位來繪製圖表", numeric_columns)
 
50
 
51
- # 添加一個生成圖表的按鈕
52
- if st.button("生成圖表"):
53
- # 顯示進度條
54
- progress_bar = st.progress(0)
55
- for i in range(100):
56
- time.sleep(0.01)
57
- progress_bar.progress(i + 1)
58
 
59
- # 創建一個標籤頁布局
60
- tab1, tab2 = st.tabs(["圓餅圖", "長條圖"])
61
 
62
- with tab1:
63
- # 使用 plotly 創建圓餅圖
64
- fig_pie = px.pie(
65
- selected_df,
66
- names='公司名稱',
67
- values=column_choice,
68
- title=f"{dataset_choice} - {column_choice} 圓餅圖",
69
- color_discrete_sequence=px.colors.qualitative.Pastel
70
- )
 
 
 
71
 
72
- fig_pie.update_traces(textposition='inside', textinfo='percent+label')
73
-
74
- # 將 legend 移到圖表的下方
75
- fig_pie.update_layout(
76
- font=dict(size=12),
77
- legend=dict(
78
- orientation="h", # 橫向排列
79
- yanchor="top", # 固定在圖表的頂部
80
- y=-0.3, # legend 移到圖表下方,調整這個值控制距離
81
- xanchor="center",
82
- x=0.5
83
- ),
84
- height=700, # 增加圖表高度
85
- margin=dict(t=50, b=50, l=50, r=50) # 邊距調整
86
- )
87
-
88
- st.plotly_chart(fig_pie, use_container_width=True)
89
-
90
- with tab2:
91
- # 使用 plotly 創建長條圖
92
- fig_bar = px.bar(selected_df, x='公司名稱', y=column_choice,
93
- title=f"{dataset_choice} - {column_choice} 長條圖",
94
- color='公司名稱',
95
- color_discrete_sequence=px.colors.qualitative.Pastel)
96
- fig_bar.update_layout(
97
- xaxis_title="企業",
98
- yaxis_title=column_choice,
99
- font=dict(size=12),
100
- xaxis_tickangle=-45,
101
- showlegend=False,
102
- height=600 # 增加圖表高度
103
- )
104
- st.plotly_chart(fig_bar, use_container_width=True)
105
-
106
- st.success("圖表生成完成!")
107
-
108
- # 下載並設置自定義字體以顯示中文字符
109
- font_url = "https://drive.google.com/uc?id=1eGAsTN1HBpJAkeVM57_C7ccp7hbgSz3_&export=download"
110
- font_response = requests.get(font_url)
111
- with open("TaipeiSansTCBeta-Regular.ttf", "wb") as font_file:
112
- font_file.write(font_response.content)
113
- fm.fontManager.addfont("TaipeiSansTCBeta-Regular.ttf")
114
- mpl.rc('font', family='Taipei Sans TC Beta')
 
 
 
 
 
 
 
2
  import pandas as pd
3
  import requests
4
  import plotly.express as px
 
 
5
  import io
 
6
 
7
+ # 設置顏色主題
8
+ theme = px.colors.qualitative.Bold
9
 
10
+ # 下載並載入 CSV 數據
11
+ def download_and_load_csv(url):
 
 
 
 
 
 
 
 
12
  response = requests.get(url)
13
  response.encoding = 'utf-8'
14
  df = pd.read_csv(io.StringIO(response.text), encoding='utf-8')
15
+ df = df.fillna(0) # 避免 NaN 錯誤
16
  return df
17
 
18
+ # 美化圖表
19
+ def beautify_chart(fig):
20
+ fig.update_layout(
21
+ font_family="Arial",
22
+ font_color="#444",
23
+ title_font_family="Arial",
24
+ title_font_color="#000",
25
+ legend_title_font_color="#000",
26
+ plot_bgcolor='rgba(0,0,0,0)',
27
+ paper_bgcolor='rgba(0,0,0,0)',
28
+ )
29
+ fig.update_xaxes(showline=True, linewidth=2, linecolor='lightgray', gridcolor='lightgray')
30
+ fig.update_yaxes(showline=True, linewidth=2, linecolor='lightgray', gridcolor='lightgray')
31
+ return fig
32
 
33
+ # **生成 Plotly 圖表**
34
+ def generate_plots(df, df_name, selected_columns, chart_type):
35
+ selected_columns = list(selected_columns) # 確保是列表
36
 
37
+ if not selected_columns:
38
+ st.error("❌ 沒有選擇數據欄位,請至少選擇一個!")
39
+ return
40
+
41
+ if "公司名稱" not in df.columns:
42
+ st.error("❌ 缺少 公司名稱 欄位,請確認數據格式!")
43
+ return
44
 
45
+ # ✅ **確保所有 y 軸數據與 x 軸 (公司名稱) 長度一致**
46
+ df = df.dropna(subset=["公司名稱"] + selected_columns) # **移除 NaN 確保長度相同**
47
+ df[selected_columns] = df[selected_columns].apply(pd.to_numeric, errors='coerce') # **轉換數據類型**
 
 
 
 
48
 
49
+ valid_columns = [col for col in selected_columns if col in df.columns and len(df[col]) == len(df["公司名稱"])]
 
50
 
51
+ if not valid_columns:
52
+ st.error(f"❌ 選擇的欄位長度與 公司名稱 不匹配,請檢查數據!\n"
53
+ f"📊 公司名稱 長度: {len(df['公司名稱'])}\n"
54
+ f"🟢 可用欄位: {valid_columns}")
55
+ return
56
+
57
+ with st.expander(f"📊 顯示 {df_name} 圖表"):
58
+ st.subheader(f"{df_name} - {chart_type} 圖")
59
+
60
+ # **根據選擇的圖表類型來繪製**
61
+ if chart_type == "折線圖":
62
+ fig = px.line(df, x="公司名稱", y=valid_columns, title=f"{df_name} - 折線圖", color_discrete_sequence=theme)
63
 
64
+ elif chart_type == "散點圖":
65
+ fig = px.scatter(df, x="公司名稱", y=valid_columns, title=f"{df_name} - 散點圖", color_discrete_sequence=theme)
66
+
67
+ elif chart_type == "長條圖":
68
+ fig = px.bar(df, x="公司名稱", y=valid_columns, title=f"{df_name} - 長條圖", color_discrete_sequence=theme)
69
+
70
+ elif chart_type == "餅圖":
71
+ total_emissions = df.groupby("公司名稱")[valid_columns].sum().reset_index()
72
+ total_emissions = total_emissions.melt(id_vars=["公司名稱"], value_vars=valid_columns, var_name="排放類型", value_name="總排放量")
73
+ fig = px.pie(total_emissions, values='總排放量', names='公司名稱', title=f"{df_name} - 餅圖", color_discrete_sequence=theme, hole=0.3)
74
+ fig.update_traces(textposition='inside', textinfo='percent+label')
75
+
76
+ fig = beautify_chart(fig)
77
+ st.plotly_chart(fig, use_container_width=True) # ✅ **讓圖表自適應畫面**
78
+
79
+ # **下載數據**
80
+ urls = [
81
+ "https://mopsfin.twse.com.tw/opendata/t187ap46_L_1.csv",
82
+ "https://mopsfin.twse.com.tw/opendata/t187ap46_O_2.csv",
83
+ "https://mopsfin.twse.com.tw/opendata/t187ap46_L_6.csv"
84
+ ]
85
+
86
+ dfs = [download_and_load_csv(url) for url in urls]
87
+ combined_df = pd.concat(dfs, ignore_index=True).fillna(0) # 合併數據並填充 NaN 值
88
+
89
+ # **再次填充 NaN 值**
90
+ combined_df = combined_df.fillna(0)
91
+
92
+ # **只顯示前300筆數據**
93
+ combined_df = combined_df.head(300)
94
+
95
+ # **Streamlit UI**
96
+ st.title("📊 台灣企業 ESG 數據分析")
97
+
98
+ st.subheader("📂 數據預覽")
99
+ st.dataframe(combined_df)
100
+
101
+ # **選擇數據欄位**
102
+ emission_columns = ["範疇一排放量(噸CO2e)", "範疇二排放量(噸CO2e)", "範疇三排放量(噸CO2e)"]
103
+ selected_columns = st.multiselect("選擇要顯示的排放類別", emission_columns, default=emission_columns[:1])
104
+
105
+ # **選擇圖表類型**
106
+ chart_type = st.selectbox("選擇圖表類型", ["折線圖", "散點圖", "長條圖", "餅圖"])
107
+
108
+ # **生成圖表**
109
+ if selected_columns:
110
+ generate_plots(combined_df, "綜合數據", selected_columns, chart_type)
111
+ else:
112
+ st.write("⚠️ 請選擇至少一個排放類別來顯示圖表。")