如何解决如何加速非内置函数?如何使用椭圆或圆形内核进行 MaxPool 操作?
我写了一段代码,对张量进行 MaxPool 操作。在这段代码中,我使用了两个 for 循环来移动矩阵上的内核。然而,当我运行这段代码时,我发现我写的代码比ready函数运行慢了50倍。可以看到我自己的函数如下:
kernel = np.ones((k,k))
p = round(0.5*(k-1))
pA = np.pad(image,((p,p),(p,p)),'constant')
dilated_image = np.zeros_like(image)
for i in range(image.shape[0]):
for j in range(image.shape[1]):
dilated_image[i,j] = np.multiply(pA[i:i+k,j:j+k],kernel).max()
return dilated_image
可以看到如下结果:
我自己函数的计时结果:
Tensorflow MaxPool 函数的时序结果:
您认为导致此类问题的原因是什么,我该如何加快此代码的运行速度?另外,有没有办法在tensorflow的MaxPool操作中做一个椭圆核?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。