案例需求:
一个电商卖背包、单肩包、双肩包,统计产品销售的总和、利润最大、最小和平均值
在销售表文件下有3个ex表:
其他双肩包和单肩包与背包数据类似。
# python读取过个ex表实现汇总统计
import pandas as pd
import os
# 合并excel文件到一个表
dir_file = "销售表"
df_list = []
for file in os.listdir(dir_file):
if file.endswith(".xlsx"):
df_list.append(pd.read_excel(f"{dir_file}/{file}"))
df_all = pd.concat(df_list)
df_all.sample(3)
def computer_data(df_sub):
return pd.Series({
"总和": round(df_sub["销售利润"].sum(), 2),
"总小": round(df_sub["销售利润"].min(), 2),
"总大": round(df_sub["销售利润"].max(), 2),
"平均": round(df_sub["销售利润"].mean(), 2),
})
df_group = df_all.groupby("产品名称").apply(computer_data)
# 输出结果excel
df_group.to_excel("按照产品汇总统计.xlsx")
效果实现如下: