如何解决Python:通过仅保留两个限制之间的数字来减少数组
我有一个数组矩阵 Nx4,我想通过仅保留第二列和第三列特定范围内的值来减少它。我写了一个不起作用的代码,因为它没有计算我已经在减少数组。
数据/数组示例:
1 358 33 7.1
2 659 85 7.1
3 111 145 7.1
4 558 116 7.1
5 632 40 7.1
6 415 335 7.1
7 207 30 7.1
8 564 47 7.1
9 352 41 7.1
10 700 570 7.1
11 275 499 7.1
12 482 177 7.1
13 737 565 7.1
14 298 43 7.1
15 155 195 7.1
16 598 417 7.1
17 93 313 7.1
18 1150 597 7.1
19 410 451 7.1
20 34 793 7.1
21 997 904 7.1
22 1024 452 7.1
23 740 128 7.1
24 522 86 7.1
25 679 643 7.1
26 973 37 7.1
27 372 42 7.1
例如,我想保留第二列的范围 = [80,2000] 和第三列的范围 = [130,2000] 的值。我的真实数组有超过 1'000'000 行。
这是我的代码:
def filter_data(data,xrange,YRANGE) :
data_f = np.copy(data)
for l in range(len(data_f)) :
if xrange[0] < data_f[l,1] < xrange[1] and YRANGE[0] < data_f[l,1] < YRANGE[1] :
pass
else :
data = np.delete(data,l,axis=0)
return data
我怎样才能以不同的方式更有效地做事?
解决方法
您可以通过使用掩码并通过计算它们的逐点乘积(相当于带有布尔值的 AND
运算符)组合它们来实现这一点:
>>> x_range,y_range = [0,2],[0,5]
>>> data
array([[ 1,2,3],[ 1,1,1],[ 5,7],10,2]])
首先根据 data[:,0]
和 data[:,1]
上的约束构造两个掩码:
>>> x_mask = (data[:,0] > x_range[0])*(data[:,0] < x_range[1])
array([ True,True,False,True])
>>> y_mask = (data[:,1] > y_range[0])*(data[:,1] < y_range[1])
array([ True,False])
本质上生成的掩码等价于 x > x_min & x < x_max & y > y_min & y < y_max
:
>>> x_mask*y_mask
array([ True,False])
>>> data[x_mask*y_mask]
array([[1,[1,1]])
,
这是我认为您在谈论的一个简单示例。
我首先创建一个示例数组 (n,3)。
然后我找到第二和第三列中的值在哪里超过一个值(我们称之为 4)并将这个乘以数组与第二和第三列的原始值相乘。
最后将这个新数组连接到原始数组的第一列,如下所示
a = np.asarray([[2,3,4],[3,4,5],[4,5,6],[10,12,14]])
val = 4
b = a[:,1:3] > val
c = a[:,1:3]*b
np.concatenate((a[:,0:1],c),axis=1)
编辑:更新示例后:for (n,4) 数组
a = np.asarray([[2,6,8],14,9]])
val = 4
b = a[:,c,a[:,3:4]),axis=1)
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。