python – 从数据帧中获取值

Scala中,我可以获取(#)或getAs [Type](#)来获取数据帧中的值.我应该如何在pyspark中做到这一点?

我有两列DataFrame:item(字符串)和salesNum(整数).我做了一个groupby,意思是得到这样的数字的平均值:

saleDF.groupBy( “salesNum”).意思是()).收集()

它的工作原理.现在我在数据框中有一个值的平均值.

如何从数据框中获取该值以将均值作为浮点数?

解决方法:

collect()以python列表的形式返回结果.要从列表中获取值,您只需要采用第一个元素:

saleDF.groupBy("salesNum").mean()).collect()[0] 
上一篇:pyspark的使用和操作(基础整理)2020-12-10


下一篇:如何将文件传递到主节点?