如何解决基于列值的百分比减少
我的数据框如下所示:
question timeSpent
a 5354
b 2344
c 2555
d 5200
e 3567
我想添加一个额外的列 score
,其中包含 0
和 1
之间的值。 timeSpent
(以秒表示)越大,score
越接近 0。如果花费的时间较小,则 score
接近 1。
如果 1
小于或等于 timeSpent
,则假设值为 2500
。然后它每过去 20%
秒下降 100
。如果它命中或大于 5500
,它会停留在 0
。
因此对于2600
,得分为0.8
,对于2700
,得分为0.64
等
我为每个间隔都编写了 if-else 语句,但我认为必须有一种更快的方法来做到这一点。
解决方法
您可以创建一个函数来计算分数并将其应用于每个timeSpent
def get_score(num):
if num <= 2500: return 1
if num >= 5500: return 0
x = 1
for _ in range((num - 2500) // 100):
x *= 0.8
return x
df = pd.DataFrame({'question': [a,b,c,d,e],'timeSpent': [5354,2344,2555,5200,3567]})
df['Score'] = df.timeSpent.apply(lambda x: get_score(x))
输出:
question timeSpent Score
0 a 5354 0.001934
1 b 2344 1.000000
2 c 2555 1.000000
3 d 5200 0.002418
4 e 3567 0.107374
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。