pandas
pandas是数据分析的核心框架,集成了数据结构化和数据清洗以及数据分析的一些方法。pandas在numpy的基础上新增了3个数据结构,Series、DataFrame、Pannel
5. 分组聚合
菜品(item):萝卜,白菜,辣椒,冬瓜
颜色(color):白,青,红
重量(weight)
价格(price)
要求以属性作为列索引,新建一个ddd
对df进行聚合操作,求出颜色为白色的价格总和
对df进行聚合操作,求出萝卜的所有重量(包括白萝卜,胡萝卜,青萝卜)以及平均价格
使用merge合并总重量及平均价格
首先创建一个DataFrame对象df
5.1 对df进行聚合操作,求出颜色为白色的价格总和
传统方法
现在修改要求
对df进行聚合操作,求出每一种颜色的价格综合
这时就要用到 分组聚合
分组聚合
根据某个属性进行分组,然后再组内对某种属性进行某种聚合
groupby 函数,用于对某个属性进行分组 分组完后我们可以通过键值的方式直接分组以后某个属性进行某种聚合
5.2 对df进行聚合操作,求出萝卜的所有重量(包括白萝卜,胡萝卜,青萝卜)以及平均价格
- 传统方法
- 分组聚合的方法