Python之Pandas isnull检查是否有缺失值

1.df.isnull()

元素级别的判断,把对应的所有元素的位置都列出来,元素为空或者NA就显示True,否则就是False

train.isnull()

Python之Pandas isnull检查是否有缺失值

2,df.isnull().any()

列级别的判断,只要该列有为空或者NA的元素,就为True,否则False

train.isnull().any()

Python之Pandas isnull检查是否有缺失值

3.df[df.isnull().values==True]

可以只显示存在缺失值的行列,清楚的确定缺失值的位置。

train[train.isnull().values==True]

Python之Pandas isnull检查是否有缺失值
导出到excel里看 dataframe.to_excel()

4.isnull().sum()

将列中为空的个数统计出来

train.isnull().sum()

Python之Pandas isnull检查是否有缺失值
5.计算变量缺失率

df=pd.read_csv('titanic_train.csv')

def missing_cal(df):
    """
    df :数据集
return:每个变量的缺失率
"""
missing_series = df.isnull().sum()/df.shape[0]
missing_df = pd.DataFrame(missing_series).reset_index()
missing_df = missing_df.rename(columns={'index':'col',
                                        0:'missing_pct'})
missing_df = missing_df.sort_values('missing_pct',ascending=False).reset_index(drop=True)
return missing_df

missing_cal(df)如果需要计算样本的缺失率分布,只要加上参数axis=1.

缺失观测的行数data3.isnull().any(axis = 1).sum()

缺失观测的比例data3.isnull().any(axis = 1).sum()/data3.shape[0]

Reference

1.xiaoxiaosuwy https://blog.csdn.net/xiaoxiaosuwy/article/details/81187694

2.Python与数据挖掘 https://zhuanlan.zhihu.com/p/187315467

3.刘顺祥 https://zhuanlan.zhihu.com/p/93179647

上一篇:尚硅谷面试第一季-16 JVM垃圾回收机制


下一篇:python数据清洗---实战案例(清洗csv文件)