如何解决遍历df行并分别对两列的值求和,直到满足其中一列的条件
我肯定仍在学习python,并尝试了无数种方法,但无法弄清楚这一点。
我有一个包含2列的数据框,分别称为A和B。我需要返回一个df,该df将对两列中的每列的行值求和,直到A的阈值总和超过某个值为止,对于这个示例,让我们说10。到目前为止,我正在尝试使用iterrows()并可以基于A> = 10来获得细分,但是直到满足阈值之前,似乎无法解决行的总和。即使最终A值不满足条件阈值,结果df也必须是详尽无遗的-请参见所需输出的最后一行。
df1 = pd.DataFrame(data = [[20,16],[10,5],[3,2],[1,1],[12,10],[9,7],[6,6],[5,2]],columns=['A','B'])
df1
A B
0 20 16
1 10 5
2 3 2
3 1 1
4 12 10
5 9 7
6 6 6
7 5 2
所需结果:
A B
0 20 16
1 10 5
2 16 13
3 15 13
4 5 2
在此先感谢您,花了很多时间,非常感谢您的帮助!!! 干杯
解决方法
我很少为熊猫编写长循环,但是我没有看到使用pandas方法执行此操作的方法。试试这个可怕的循环:(:
- 我创建的变量
View view = inflater.inflate(R.layout.fragment_layout,container);
本质上是在检查累积和,以查看是否>View view = inflater.inflate(R.layout.fragment_layout,container,false);
(我们将其设置为10)。然后,我们决定使用t
,它是任何给定行的数据帧中的累加值或n
的值(t
和i
与B列也是如此。 - 有一些条件,所以有些
j
语句,并且最后一行的行为与我设置行为的方式不同,因此对于最后一行{{ 1}}-否则最后一个值将不会被附加:
u
,
这是一个更短的作品:
import pandas as pd
df1 = pd.DataFrame(data = [[20,16],[10,5],[3,2],[1,1],[12,10],[9,7],[6,6],[5,2]],columns=['A','B'])
df2 = pd.DataFrame()
index = 0
while index < df1.size/2:
if df1.iloc[index]['A'] >= 10:
a = df1.iloc[index]['A']
b = df1.iloc[index]['B']
temp_df = pd.DataFrame(data=[[a,b]],'B'])
df2 = df2.append(temp_df,ignore_index=True)
index += 1
else:
a_sum = 0
b_sum = 0
while a_sum < 10 and index < df1.size/2:
a_sum += df1.iloc[index]['A']
b_sum += df1.iloc[index]['B']
index += 1
if a_sum >= 10:
temp_df = pd.DataFrame(data=[[a_sum,b_sum]],'B'])
df2 = df2.append(temp_df,ignore_index=True)
else:
a = df1.iloc[index-1]['A']
b = df1.iloc[index-1]['B']
temp_df = pd.DataFrame(data=[[a,ignore_index=True)
关键是要跟踪您在DataFrame中的位置并跟踪总和。不要害怕使用变量。
在Pandas中,使用iloc按索引访问每一行。通过检查大小确保不超出DataFrame。 df.size返回元素的数量,因此它将行乘以列。这就是为什么我将大小除以列数,以获得实际的行数的原因。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。