微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python – 划分两个pandas DataFrames并保留非数字列

我有两个包含数字和非数字值的pandas DataFrame.我想将一个除以另一个,但保留非数字列.这是一个MWE:

a = pd.DataFrame(
    [
        ['group1', 1., 2.],
        ['group1', 3., 4.],
        ['group1', 5., 6.]
    ], 
    columns=['Group', 'A', 'B']
)

b = pd.DataFrame(
    [
        ['group1', 7., 8.],
        ['group1', 9., 10.],
        ['group1', 11., 12.]
    ],
    columns=['Group', 'A', 'B']
)

试图做:

b.div(a)

结果是:

TypeError: unsupported operand type(s) for /: 'str' and 'str'

所以为了解决这个问题,我做了:

result = b.drop(["Group"], axis=1).div(a.drop(["Group"], axis=1))
print(result)
#     A    B
#0  7.0  4.0
#1  3.0  2.5
#2  2.2  2.0

哪个是正确的,但我还想保留“Group”列.

获得我想要的输出的一种方法是:

desired_output = b[["Group"]].join(result)
print(desired_output)
#    Group    A    B
#0  group1  7.0  4.0
#1  group1  3.0  2.5
#2  group1  2.2  2.0

但我真正的DataFrames有许多非数字列.是否有更清洁/更快/更有效的方法来告诉大熊猫只划分数字列?

解决方法:

您可以使用np.divide,将掩码传递给where参数.

np.divide(b, a, where=a.dtypes.ne(object))

假设DataFrame中的非数字列相同,请使用combine_first / fillna将其返回:

np.divide(b, a, where=a.dtypes.ne(object)).combine_first(a)


    Group    A    B
0  group1  7.0  4.0
1  group1  3.0  2.5
2  group1  2.2  2.0

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐