我有两个包含数字和非数字值的pandas DataFrame.我想将一个除以另一个,但保留非数字列.这是一个MWE:
a = pd.DataFrame(
[
['group1', 1., 2.],
['group1', 3., 4.],
['group1', 5., 6.]
],
columns=['Group', 'A', 'B']
)
b = pd.DataFrame(
[
['group1', 7., 8.],
['group1', 9., 10.],
['group1', 11., 12.]
],
columns=['Group', 'A', 'B']
)
试图做:
b.div(a)
结果是:
TypeError: unsupported operand type(s) for /: 'str' and 'str'
所以为了解决这个问题,我做了:
result = b.drop(["Group"], axis=1).div(a.drop(["Group"], axis=1))
print(result)
# A B
#0 7.0 4.0
#1 3.0 2.5
#2 2.2 2.0
哪个是正确的,但我还想保留“Group”列.
desired_output = b[["Group"]].join(result)
print(desired_output)
# Group A B
#0 group1 7.0 4.0
#1 group1 3.0 2.5
#2 group1 2.2 2.0
但我真正的DataFrames有许多非数字列.是否有更清洁/更快/更有效的方法来告诉大熊猫只划分数字列?
解决方法:
您可以使用np.divide,将掩码传递给where参数.
np.divide(b, a, where=a.dtypes.ne(object))
假设DataFrame中的非数字列相同,请使用combine_first / fillna将其返回:
np.divide(b, a, where=a.dtypes.ne(object)).combine_first(a)
Group A B
0 group1 7.0 4.0
1 group1 3.0 2.5
2 group1 2.2 2.0
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。