Pandas(loc,apply)

一.取数

单列

1.pd['列名']

2.pd.loc[:,'列名']

3.pd.iloc[:,3] 数字代表列索引

4.pd.列名

多列

1.pd.loc[:,'列1':'列5'] 取列1到列5这个区间的数据

2.pd.loc[:,['列1','列2']] 罗列需要取得列名称

注意:建议使用loc的方式,因为可读性比较高

二:布尔索引

1.三元表达式

java:  x>10 ? x : 0 表示当x>10 的时候返回x,否则返回0

python: x if(x>10) else 0 表示当x>10 的时候返回x,否则返回0

2.Lambda表达式

lambda x : func(x)
结合三元表达式
lambda x : x if(x>10) else 0 

函数:isdigit() 可以返回是否能转成int类型的boolean结果

3.apply函数

apply(func(),axis=0/1,args...)
1.如果参数是Series类型,则每次处理单个数据处理
2.如果参数是DataFrame类型,则每次处理一个Series类型的数据

4.DataFrame

Pandas(loc,apply)

5.map()/apply()/applymap()

map()的功能是将一个自定义函数作用于Series对象的每个元素
apply()函数的功能是将一个自定义函数作用于DataFrame的行或者列
applymap()函数的功能是将自定义函数作用于DataFrame的所有元素

注意:DataFrame对象的一行或者一列可以看成一个Series对象,因此也适用map()函数

Frame的所有元素


*注意:DataFrame对象的一行或者一列可以看成一个Series对象,因此也适用map()函数*



上一篇:Matplotlib属性


下一篇:使用自签名证书支持gitlab https