Spaces:

JUNGU
/

PPPDC_example

Build error

App Files Files Community

JUNGU commited on Jul 20, 2024

Commit

9357bdd

verified ·

1 Parent(s): fb18f50

Update app.py

Browse files

Files changed (1) hide show

app.py +97 -6

app.py CHANGED Viewed

@@ -8,6 +8,7 @@ import openpyxl
 import matplotlib.font_manager as fm
 from scipy import stats
 import os
 #사이즈 크게
 st.set_page_config(layout="wide")
@@ -177,6 +178,69 @@ def plot_correlation_heatmap(data):
     else:
         st.warning("상관관계 히트맵을 그릴 수 있는 숫자형 열이 없습니다.")
 def plot_scatter_with_regression(data, x_var, y_var):
     # 회귀 분석 수행
     x = data[x_var]
@@ -259,12 +323,10 @@ def perform_analysis():
     # 데이터가 변경될 때마다 필터링된 데이터 업데이트
     st.session_state.filtered_data = apply_slicers(st.session_state.processed_data)
-    # 2열 레이아웃 생성
-    col1, col2 = st.columns(2)
     with col1:
         # 요약 통계
         st.write("요약 통계:")
         st.write(st.session_state.filtered_data.describe())
@@ -274,7 +336,6 @@ def perform_analysis():
         plot_correlation_heatmap(st.session_state.filtered_data)
     with col2:
         # 사용자가 선택한 두 변수에 대한 산점도 및 회귀 분석
         st.subheader("두 변수 간의 관계 분석")
         x_var = st.selectbox("X축 변수 선택", options=st.session_state.numeric_columns, key='x_var')
@@ -283,11 +344,41 @@ def perform_analysis():
         if x_var and y_var:
             plot_scatter_with_regression(st.session_state.filtered_data, x_var, y_var)
     # '다른 데이터 분석하기' 버튼 추가
     if st.button("다른 데이터 분석하기(오류가 나면 다시 눌러주세요)"):
         reset_session_state()
         st.experimental_rerun()
 def main():
     st.title("모두가 할 수 있는 데이터 분석 툴킷")

 import matplotlib.font_manager as fm
 from scipy import stats
 import os
+import plotly.figure_factory as ff
 #사이즈 크게
 st.set_page_config(layout="wide")
     else:
         st.warning("상관관계 히트맵을 그릴 수 있는 숫자형 열이 없습니다.")
+def check_normality(data, column):
+    # 시각적 검사: Q-Q plot
+    fig = go.Figure()
+    qq = stats.probplot(data[column], dist="norm")
+    fig.add_trace(go.Scatter(x=qq[0][0], y=qq[0][1], mode='markers', name='Sample Quantiles'))
+    fig.add_trace(go.Scatter(x=qq[0][0], y=qq[1][0] * qq[0][0] + qq[1][1], mode='lines', name='Theoretical Quantiles'))
+    fig.update_layout(title=f'Q-Q Plot for {column}', xaxis_title='Theoretical Quantiles', yaxis_title='Sample Quantiles')
+    st.plotly_chart(fig)
+    # 통계적 검사: Shapiro-Wilk test
+    stat, p = stats.shapiro(data[column])
+    st.write(f"Shapiro-Wilk Test for {column}:")
+    st.write(f"통계량: {stat:.4f}")
+    st.write(f"p-value: {p:.4f}")
+    if p > 0.05:
+        st.write("데이터가 정규 분포를 따르는 것으로 보입니다 (귀무가설을 기각하지 못함)")
+    else:
+        st.write("데이터가 정규 분포를 따르지 않는 것으로 보입니다 (귀무가설 기각)")
+def perform_independent_ttest(data, group_column, value_column):
+    groups = data[group_column].unique()
+    if len(groups) != 2:
+        st.error("독립 표본 t-검정은 정확히 두 그룹이 필요합니다.")
+        return
+    group1 = data[data[group_column] == groups[0]][value_column]
+    group2 = data[data[group_column] == groups[1]][value_column]
+    t_stat, p_value = stats.ttest_ind(group1, group2)
+    st.write(f"독립 표본 T-검정 결과:")
+    st.write(f"t-통계량: {t_stat:.4f}")
+    st.write(f"p-value: {p_value:.4f}")
+    if p_value < 0.05:
+        st.write("두 그룹 간에 유의한 차이가 있습니다.")
+    else:
+        st.write("두 그룹 간에 유의한 차이가 없습니다.")
+def perform_paired_ttest(data, before_column, after_column):
+    t_stat, p_value = stats.ttest_rel(data[before_column], data[after_column])
+    st.write(f"대응 표본 T-검정 결과:")
+    st.write(f"t-통계량: {t_stat:.4f}")
+    st.write(f"p-value: {p_value:.4f}")
+    if p_value < 0.05:
+        st.write("전후 측정값 간에 유의한 차이가 있습니다.")
+    else:
+        st.write("전후 측정값 간에 유의한 차이가 없습니다.")
+def perform_onesample_ttest(data, column, test_value):
+    t_stat, p_value = stats.ttest_1samp(data[column], test_value)
+    st.write(f"단일 표본 T-검정 결과:")
+    st.write(f"t-통계량: {t_stat:.4f}")
+    st.write(f"p-value: {p_value:.4f}")
+    if p_value < 0.05:
+        st.write(f"표본 평균이 {test_value}와 유의하게 다릅니다.")
+    else:
+        st.write(f"표본 평균이 {test_value}와 유의하게 다르지 않습니다.")
 def plot_scatter_with_regression(data, x_var, y_var):
     # 회귀 분석 수행
     x = data[x_var]
     # 데이터가 변경될 때마다 필터링된 데이터 업데이트
     st.session_state.filtered_data = apply_slicers(st.session_state.processed_data)
+    # 3열 레이아웃 생성
+    col1, col2, col3 = st.columns(3)
     with col1:
         # 요약 통계
         st.write("요약 통계:")
         st.write(st.session_state.filtered_data.describe())
         plot_correlation_heatmap(st.session_state.filtered_data)
     with col2:
         # 사용자가 선택한 두 변수에 대한 산점도 및 회귀 분석
         st.subheader("두 변수 간의 관계 분석")
         x_var = st.selectbox("X축 변수 선택", options=st.session_state.numeric_columns, key='x_var')
         if x_var and y_var:
             plot_scatter_with_regression(st.session_state.filtered_data, x_var, y_var)
+    with col3:
+        st.subheader("통계적 검정")
+        # 정규성 검정
+        st.write("정규성 검정")
+        normality_column = st.selectbox("정규성 검정을 수행할 열 선택:", st.session_state.numeric_columns, key='normality_column')
+        if st.button("정규성 검정 수행"):
+            check_normality(st.session_state.filtered_data, normality_column)
+        # T-검정
+        st.write("T-검정")
+        test_type = st.radio("T-검정 유형 선택:", ["독립 표본", "대응 표본", "단일 표본"])
+        if test_type == "독립 표본":
+            group_column = st.selectbox("그룹 열 선택:", st.session_state.categorical_columns)
+            value_column = st.selectbox("값 열 선택:", st.session_state.numeric_columns)
+            if st.button("독립 표본 T-검정 수행"):
+                perform_independent_ttest(st.session_state.filtered_data, group_column, value_column)
+        elif test_type == "대응 표본":
+            before_column = st.selectbox("'이전' 열 선택:", st.session_state.numeric_columns)
+            after_column = st.selectbox("'이후' 열 선택:", [col for col in st.session_state.numeric_columns if col != before_column])
+            if st.button("대응 표본 T-검정 수행"):
+                perform_paired_ttest(st.session_state.filtered_data, before_column, after_column)
+        elif test_type == "단일 표본":
+            test_column = st.selectbox("검정할 열 선택:", st.session_state.numeric_columns)
+            test_value = st.number_input("검정 값 입력:")
+            if st.button("단일 표본 T-검정 수행"):
+                perform_onesample_ttest(st.session_state.filtered_data, test_column, test_value)
     # '다른 데이터 분석하기' 버튼 추가
     if st.button("다른 데이터 분석하기(오류가 나면 다시 눌러주세요)"):
         reset_session_state()
         st.experimental_rerun()
 def main():
     st.title("모두가 할 수 있는 데이터 분석 툴킷")