微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python – Pandas:在列的每一行中查找最大值,并在另一列中标识相应的值

我有两个pandas数据框列,其值是元组列表,如:

df[‘A’].values
(1.55, 2.07, 2.20, 2.23)
(0.67, 1.10, 1.73, 1.35)
(2.92, 1.98, 2.30, 2.66)

df[‘B’].values
(1.55, 0.0086, 0.078, 0.12)
(0.672, 0.142, 0.0166, 0.0173)
(1.97, 0.0094, 0.1648, 0.016)

我想为df [‘A’]的每一行选择最大值,并在df [‘B’]的相应位置找到该值以生成新列,例如:

> df[‘C’]
0.12
0.0166
1.97

解决方法:

import pandas as pd
import numpy as np


df_dict = dict(A=[(1.55, 2.07, 2.20, 2.23), (0.67, 1.10, 1.73, 1.35), (2.92, 1.98, 2.30, 2.66)],
    B=[(1.55, 0.0086, 0.078, 0.12), (0.672, 0.142, 0.0166, 0.0173), (1.97, 0.0094, 0.1648, 0.016)])

df = pd.DataFrame(df_dict)

Out[180]: 
                         A                               B
0  (1.55, 2.07, 2.2, 2.23)     (1.55, 0.0086, 0.078, 0.12)
1  (0.67, 1.1, 1.73, 1.35)  (0.672, 0.142, 0.0166, 0.0173)
2  (2.92, 1.98, 2.3, 2.66)   (1.97, 0.0094, 0.1648, 0.016)

def apply_func(row):
    return row.B[np.array(row.A).argmax()]

df['C'] = df.apply(apply_func, axis=1)

Out[182]: 
                         A                               B       C
0  (1.55, 2.07, 2.2, 2.23)     (1.55, 0.0086, 0.078, 0.12)  0.1200
1  (0.67, 1.1, 1.73, 1.35)  (0.672, 0.142, 0.0166, 0.0173)  0.0166
2  (2.92, 1.98, 2.3, 2.66)   (1.97, 0.0094, 0.1648, 0.016)  1.9700

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐