pandas dataframe数据聚合groupby、agg、privot基于sum统计详解及实例

pandas dataframe数据聚合groupby、agg、privot基于sum统计详解及实例

知道了sum、那么min、max、mean、median都是举一反三的事情了。

在日常的数据分析中,经常需要将数据根据某个(多个)字段划分为不同的群体(group)进行分析,如电商领域将全国的总销售额根据省份进行划分,分析各省销售额的变化情况,社交领域将用户根据画像(性别、年龄)进行细分,研究用户的使用情况和偏好等。

在Pandas中,上述的数据处理操作主要运用groupby完成。

聚合(aggregate)操作是groupby后非常常见的操作,会写SQL的朋友对此应该是非常熟悉了。聚合操作可以用来求和、均值、最大值、最小值等;

 

goupby的底层逻辑:和apply的千层万缕,还是老规矩、看图说话:

 

 

pandas dataframe数据聚合groupby、agg、privot基于sum统计详解及实例

pandas dataframe数据聚合groupby、agg、privot基于sum统计详解及实例

 

上一篇:python astype+groupby+sign+agg


下一篇:DataFrame的groupby结合agg自定义函数