如何解决如何在pyspark中使用reduce动态填充?
我创建了这个函数来将基于输入参数的 fillna 应用于数据帧,但它似乎覆盖了最后一个参数,例如此处缺少,而不是第一个参数的输出。
这是我的功能:
def fillna(df,params):
return reduce(
lambda data,rules: data.fillna(rules[0],subset=rules[1]),params.items(),df,)
where df: input dataframe
params={0:['age'],Missing: ['name']} #
input :
id age name
1 12 tan
2 saks
3 23
output:
id age name
1 12 tan
2 0 saks
3 23 missing
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。