它们的区别就在于应用对象的不同
1、map
map()是Series对象的一个函数,DataFrame中没有map(),map()的功能是将一个自定义函数作用于Series对象的每个元素。
eg:
1 frame = pd.DataFrame({
‘key1‘:[‘a‘,‘b‘,‘c‘,‘d‘],
‘key2‘:[‘one‘,‘two‘,‘three‘,‘four‘],
‘data1‘:np.arange(4),
‘data2‘:np.arange(5,9)
})
2 df
现在使用map()函数来将data1这一列的数据改为保留三位小数显示
1 df[‘data1‘] = df[‘data1‘].map(lambda x : "%.3f"%x)
运行结果:
2、apply
apply()函数的功能是将一个自定义函数作用于DataFrame的行或者列
eg:现在使用apply()对data1和data2相加
df[‘total‘] = df[[‘data1‘,‘data2‘]].apply(lambda x : x.sum(), axis = 1)
运行结果:
df.loc[‘total‘] = df[[‘data1‘,‘data2‘]].apply(lambda x : x.sum(), axis = 0) #注意索引行必须用loc
3、applymap
applymap()函数的功能是将自定义函数作用于DataFrame的所有元素
eg:现在将DataFrame的所有元素前面加字符#
1 def add(n):
2 return ‘#‘ + str(n)
3 df.applymap(add)
运行结果:
容易发现,DataFrame对象的一行或者一列可以看成一个Series对象,因此也适用map()函数,几个对象之间可以互相转化,注意灵活使用。