在Scala中,我可以获取(#)或getAs [Type](#)来获取数据帧中的值.我应该如何在pyspark中做到这一点?
我有两列DataFrame:item(字符串)和salesNum(整数).我做了一个groupby,意思是得到这样的数字的平均值:
saleDF.groupBy( “salesNum”).意思是()).收集()
它的工作原理.现在我在数据框中有一个值的平均值.
如何从数据框中获取该值以将均值作为浮点数?
解决方法:
collect()以python列表的形式返回结果.要从列表中获取值,您只需要采用第一个元素:
saleDF.groupBy("salesNum").mean()).collect()[0]