pandas.DataFrame的groupby()方法的基本使用

pandas.DataFrame的groupby()方法是一个特别常用和有用的方法。让我们快速掌握groupby()方法的基础使用,从此数据分析又多一法宝。

首先导入package:

import pandas as pd
import numpy as np

groupby的最基本操作

df = pd.DataFrame({'A':[1,2,3,1],'B':[2,3,3,6],'C':[3,1,5,7]})
df

pandas.DataFrame的groupby()方法的基本使用

 

 

 按照A列来进行分组(其实说白了就是将A列中重复的值和成同一个值,然后把A当成索引来进行重新的数据分组)

df.groupby('A').mean() #mean是取平均值

pandas.DataFrame的groupby()方法的基本使用

df.groupby('A').sum() #sum是求和

pandas.DataFrame的groupby()方法的基本使用

df.groupby(['A']).first() #取第一个出现的数据

pandas.DataFrame的groupby()方法的基本使用

df.groupby(['A']).last() #取最后一个出现的数据

pandas.DataFrame的groupby()方法的基本使用

 也可以按照多组进行分组

df.groupby(['A','B']).sum()

pandas.DataFrame的groupby()方法的基本使用

 

统计数据的数量 

size跟count的区别: size计数时包含NaN值,而count不包含NaN值

df = pd.DataFrame({'A':[1,2,3,1],'B':[2,3,3,6],'C':[3,np.nan,5,7]})
df

pandas.DataFrame的groupby()方法的基本使用

df.groupby(['A']).count()

pandas.DataFrame的groupby()方法的基本使用

df.groupby(['A']).size()

pandas.DataFrame的groupby()方法的基本使用

上一篇:2019年快手笔试题:字符串压缩(python版)


下一篇:LINQ基础—GroupBy子句