如何解决在 Pandas 中组合列并加入非缺失值
df = pd.DataFrame([[1,2,3,None],[1,[None,1]],columns=["A","B","C","AA"])
A | B | C | AA |
---|---|---|---|
1 | 2 | 3 | |
1 | 2 | 3 | |
2 | 3 | 1 |
AA 列实际上与 A 相同,但在数据处理管道的某个重要步骤中出现了拼写错误。
我怎样才能真正将 ['AA'] 重命名为 ['A'] 并移动非缺失值?示例:
A | B | C |
---|---|---|
1 | 2 | 3 |
1 | 2 | 3 |
1 | 2 | 3 |
我想如果我这样做:
df['A'] = df['AA']
空值将被复制。
那么,这里有什么提示吗?
解决方法
你可以试试combine_first:
In [8]: df.assign(A=df.A.combine_first(df.AA)).drop(columns='AA')
Out[8]:
A B C
0 1.0 2 3
1 1.0 2 3
2 1.0 2 3
3 1.0 2 3
,
将它们加在一起:
df['A'] = df[['A','AA']].sum(axis=1)
结果是:
A B C AA
0 1.0 2 3 NaN
1 1.0 2 3 NaN
2 1.0 2 3 NaN
3 1.0 2 3 1.0
,
要添加到@mullinscr,首先对列求和,然后删除“AA”列
df['A'] = df[['A','AA']].sum(axis=1)
df.drop('AA',axis=1,inplace=True)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。