我有一个带有null / empty值的数据帧.
通过执行以下操作,我可以轻松获取空值的每一行的计数:
df['NULL_COUNT'] = len(df[fields] - df.count(axis=1)
这将在字段NULL_COUNT中放置NULL的列数.
有没有办法将列标题以相同的方式写入另一个字段,如果它为null?
df['NULL_FIELD_NAMES'] = "<some query expression>"
例:
df = pd.DataFrame([range(3), [0, np.NaN, 0], [0, 0, np.NaN], range(3), range(3)], columns=['A', 'B', 'C'])
在上面的df中,第二行应该有df [‘NULL_FIELD_NAME’] =’B’,第三行应该有df [‘NULL_FIELD_NAME’] =’C’
解决方法:
您可以使用:
df['new'] = (df.isnull() * df.columns.to_series()).apply(','.join,axis=1).str.strip(',')
另一种方案:
df['new'] = df.apply(lambda x: ','.join(x[x.isnull()].index),axis=1)
样品:
df = pd.DataFrame([range(3), [np.NaN, np.NaN, 0], [0, 0, np.NaN], range(3), range(3)],
columns=['A', 'B', 'C'])
print (df)
A B C
0 0.0 1.0 2.0
1 NaN NaN 0.0
2 0.0 0.0 NaN
3 0.0 1.0 2.0
4 0.0 1.0 2.0
df['new'] = df.apply(lambda x: ','.join(x[x.isnull()].index),axis=1)
print (df)
A B C new
0 0.0 1.0 2.0
1 NaN NaN 0.0 A,B
2 0.0 0.0 NaN C
3 0.0 1.0 2.0
4 0.0 1.0 2.0
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。