一般情况
df.groupby(‘column1‘)[‘column2‘].sum()
这样会造成column1成为index
column2聚合后没有列名
优化
df.groupby(‘column1‘,as_index=Flase).agg({‘column2‘.‘sum‘})
或者多列分类
df.groupby([‘column1‘,‘column2‘],as_index=Flase).agg({‘column3‘.‘sum‘})
这样就会都有列名
c1 c2 c3
0
1
2
之后再rename c3,重命名一个聚合列名
df.rename({‘c3‘:‘c3_sum‘})