Spaces:

kaicheng
/

merge_excle_for_Q

Sleeping

App Files Files Community

kaicheng commited on Sep 11, 2023

Commit

456b990

1 Parent(s): 5000b68

Update app.py

Browse files

Files changed (1) hide show

app.py +43 -24

app.py CHANGED Viewed

@@ -1,31 +1,50 @@
-# # 定义一个函数，该函数将接受上传的XLSX文件并显示其内容
-# def read_xlsx(file):
-#     try:
-#         # 使用pandas读取上传的XLSX文件
-#         df = pd.read_excel(file.name)
-#         # 返回XLSX文件的内容
-#         return df.to_html()
-#     except Exception as e:
-#         return str(e)
-# # 创建Gradio界面
-# iface = gr.Interface(
-#     fn=read_xlsx,
-#     inputs=gr.inputs.File(label="上传XLSX文件"),
-#     outputs=gr.outputs.HTML(),
-#     title="XLSX文件内容查看器"
-# )
-# # 启动Gradio应用程序
-# iface.launch()
 import gradio as gr
 import pandas as pd
 def process_excel(file):
     df = pd.read_excel(file.name, engine='openpyxl')
-    df = pd.DataFrame(df)
     return df
-iface = gr.Interface(fn=process_excel, inputs="file", outputs=[gr.outputs.Dataframe(type='pandas')], title="Excel Processor")
-iface.launch(debug=True)

 import gradio as gr
 import pandas as pd
 def process_excel(file):
+    # 注意这里的file.name，如果自己在线下python环境运行的话要删掉（.name）
     df = pd.read_excel(file.name, engine='openpyxl')
     return df
+def merge_excel_tables(file_path1, file_path2,output_file = '合并后的表.xlsx'):
+    # 读取第一张表
+    df1 = process_excel(file_path1)
+    # 读取第二张表
+    df2 = process_excel(file_path2)
+    # 执行关联操作，假设关联列名为'关联列'
+    merged_df = df1.merge(df2,  left_on=list(df1.columns)[0], right_on=list(df2.columns)[0], how='left')
+    # 重命名合并后的表格的列名，去除_x和_y后缀
+    column_mapping = {}
+    for col in df1.columns:
+        column_mapping[col] = col
+    for col in merged_df.columns:
+        if col.endswith('_x'):
+            new_col = col[:-2]  # 去除_x后缀
+            if new_col in column_mapping:
+                column_mapping[new_col] = new_col  # 如果存在相同的列名，保持不变
+            merged_df.rename(columns={col: new_col}, inplace=True)
+        elif col.endswith('_y'):
+            new_col = col[:-2]  # 去除_y后缀
+            merged_df.rename(columns={col: new_col}, inplace=True)
+    # 删除没有数据的列
+    merged_df = merged_df.dropna(axis=1, how='all')
+     #把修改后表格的标签写好
+    merged_df = merged_df[list(df1.columns)]
+    # # 保存结果到新的Excel文件
+    # merged_df.to_excel(output_file, index=False)
+    return merged_df
+iface = gr.Interface(fn=merge_excel_tables,
+                     inputs=[gr.File(type='file',label='excle表格1'),
+                             gr.File(type='file',label='excle表格2')],
+                     outputs=[gr.outputs.Dataframe(type='pandas',label='合并后表格')],
+                     title="强哥的Excel Processor")
+iface.launch()