处理数据中的缺失值

数据集:

处理数据中的缺失值 

train=pd.read_csv('./1.csv')//用代码读取数据 print(train)//并对其输出 输出结果:

    id    sd   q
0 NaN 7.0 1.0
1 NaN NaN NaN
2 NaN 4.0 7.0
3 4.0 NaN 6.0
4 NaN 6.0 11.0
5 2.0 NaN 3.0

补充缺失值的几种方法。

1、将所有缺失值补为0。

2、用缺失值上面的值,对其进行补充。

3、用缺失值下面的值,对其进行补充。

1:

用0补充缺失值用fillna(0)

代码:

train=pd.read_csv('./1.csv') train=train.fillna(0) print(train) 输出结果: 处理数据中的缺失值

 

 2:

用缺失值上面的值对其进行代替用函数

data = data.fillna(axis=0,method='ffill')

print(data)

输出结果:

处理数据中的缺失值

 

 得出结论边界为Nan时,采用上边界值补全缺失值不会报错,但不会处理上边界的缺失值。

method参数:

处理数据中的缺失值

 

ffill参数其翻译过来就是取前一个数对缺失值进行填充。

axis表示取填充值的方向0为竖轴方向,1为横向。

处理数据中的缺失值

 如果加上limit代表能连续填充多少个值:

比如

1

Nan

Nan

Nan

如果limit=2

就会变为

1

1

1

Nan

 

上一篇:JavaScript数字(数值)


下一篇:机器学习sklearn(五): 数据处理(二)缺失值处理