一.取数
单列
1.pd['列名']
2.pd.loc[:,'列名']
3.pd.iloc[:,3] 数字代表列索引
4.pd.列名
多列
1.pd.loc[:,'列1':'列5'] 取列1到列5这个区间的数据
2.pd.loc[:,['列1','列2']] 罗列需要取得列名称
注意:建议使用loc的方式,因为可读性比较高
二:布尔索引
1.三元表达式
java: x>10 ? x : 0 表示当x>10 的时候返回x,否则返回0
python: x if(x>10) else 0 表示当x>10 的时候返回x,否则返回0
2.Lambda表达式
lambda x : func(x)
结合三元表达式
lambda x : x if(x>10) else 0
函数:isdigit() 可以返回是否能转成int类型的boolean结果
3.apply函数
apply(func(),axis=0/1,args...)
1.如果参数是Series类型,则每次处理单个数据处理
2.如果参数是DataFrame类型,则每次处理一个Series类型的数据
4.DataFrame
5.map()/apply()/applymap()
map()的功能是将一个自定义函数作用于Series对象的每个元素
apply()函数的功能是将一个自定义函数作用于DataFrame的行或者列
applymap()函数的功能是将自定义函数作用于DataFrame的所有元素
注意:DataFrame对象的一行或者一列可以看成一个Series对象,因此也适用map()函数
Frame的所有元素
*注意:DataFrame对象的一行或者一列可以看成一个Series对象,因此也适用map()函数*