python – PySpark用其他列中的值替换列中的null

我想用一个相邻列中的值替换一列中的空值,例如,如果我有

A|B
0,1
2,null
3,null
4,2

我希望它是:

A|B
0,1
2,2
3,3
4,2

试过

df.na.fill(df.A,"B")

但是没有用,它说值应该是float,int,long,string或dict

有任何想法吗?

解决方法:

最后找到了另一种选择:

df.withColumn("B",coalesce(df.B,df.A)) 
上一篇:Android Architecture Components


下一篇:python – 向Spark DataFrame添加一个空列