如何解决如何向前滚动特定的数据子集并同时修改原始数据集?
我正在尝试对此数据集执行此操作。我正在尝试计算数据集特定子集的累积总和。我希望更改反映在真实数据集上。 .下表说明了我想如何计算偏移。
#OFFSET
min = data.exit_block.min()
max = data.exit_block.max()
temp = 0
data['Offset']
for i in tqdm(range(min,min+10)):
offset = data.loc[(data["exit_block"] >= i) & (data["entry_block"] < i)]['size'].sum()
data.loc[data["entry_block"] == i,'Offset'] = data[data['entry_block']==i]['size'].cumsum() + offset
print(len(data.loc[(data["exit_block"] >= i) & (data["entry_block"] < i)]['size']))
print(offset)
print(data[data['entry_block']==i]['size'].cumsum().head() )
print(data[data['entry_block']==i]['size'].head())
break
在上面的代码中,我正在从原始数据集创建一个数据集 B,并尝试从 数据集 B 驱动的值对原始数据集执行累积求和运算。强>
索引 | Entry_block | Exit_block | 尺寸 | 偏移 |
---|---|---|---|---|
1 | 10 | 20 | 10 | 10 |
2 | 11 | 20 | 150 | 160 |
3 | 18 | 20 | 100 | 260 |
4 | 19 | 21 | 40 | 300 |
5 | 20 | 21 | 120 | 120 |
6 | 20 | 21 | 180 | 300 |
7 | 20 | 21 | 210 | 510 |
8 | 20 | 21 | 90 | 600 |
9 | 20 | 21 | 450 | 1050 |
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。