微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

熊猫用 min 函数填充列值

如何解决熊猫用 min 函数填充列值

我有一个包含 2 列的数据框,我需要添加第三列“开始”。但是我的代码由于某种原因不起作用,我不确定为什么。这是我的代码

df.loc[df.type=='C','start']= min(-1+df['dq']-3,4)
df.loc[df.type=='A','start']= min(-3+df['dq']-3,4)
df.loc[df.type=='B','start']= min(-3+df['dq']-5,4)

ValueError: The truth value of a Series is ambiguous. Use a.empty,a.bool(),a.item(),a.any() or a.all().

数据集如下所示:

type        dq
A            3
A            4
B            8
C            3

解决方法

引发错误是因为您传递给 min() 的第一个参数是一个系列,而第二个 (4) 是一个 int

由于您使用 min 将大于 4 的值替换为 4,因此您只需在最后使用 where 替换一次:

df.loc[df.type=='C','start'] = -1+df['dq']-3
df.loc[df.type=='A','start'] = -3+df['dq']-3
df.loc[df.type=='B','start'] = -3+df['dq']-5
df["start"] = df["start"].where(df["start"]<4,other=4)

>>> df
  type  dq  start
0    A   3     -3
1    A   4     -2
2    B   8      0
3    C   3     -1

获取列的另一种(可能更简洁)方法是使用 numpy.select,如下所示:

import numpy as np

df["start"] = np.select([df["type"]=="A",df["type"]=="B",df["type"]=="C"],[df['dq']-6,df["dq"]-8,df["dq"]-4])
df["start"] = df["start"].where(df["start"]<4,4)
,

您不能使用带 min 的系列。相反,您可以这样做:

s = (df['dq'] - df['type'].map({'A': 6,'B': 8,'C': 4}))
df['start'] = s.where(s<4,4)

输出:

  type  dq  start
0    A   3     -3
1    A   4     -2
2    B   8      0
3    C   3     -1

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。