最一般化的groupby 方法是apply.
tips=pd.read_csv('tips.csv')
tips[:5]
新生成一列
tips['tip_pct']=tips['tip']/tips['total_bill']
tips[:6]
根据分组选出最高的5个tip_pct值
def top(df,n=5,column='tip_pct'):
return df.sort_index(by=column)[-n:]
top(tips,n=6)
对smoker分组并应用该函数
tips.groupby('smoker').apply(top)
本文转自张昺华-sky博客园博客,原文链接:http://www.cnblogs.com/bonelee/p/7596676.html,如需转载请自行联系原作者