微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Pyspark groupby 并计算空值

如何解决Pyspark groupby 并计算空值

PySpark Dataframe Groupby and Count Null Values

参考上面的解决方链接,我正在尝试应用相同的逻辑,但 groupby("country") 并获取另一列的空计数,并且出现“列不可迭代”失败。有人可以帮忙吗?

df7.groupby("country").agg(*(sum(col(c).isNull().cast("int")).alias(c) for c in columns))

解决方法

covid_india_df.select(
    [
        funcs.count(
            funcs.when((funcs.isnan(clm) | funcs.col(clm).isNull()),clm)
        ).alias(clm) for clm in covid_india_df.columns
    ]
).show()

上述方法可能会帮助您获得正确的结果。 Check here 获取完整示例。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?