如何解决ipad2霓虹浮点数速度相对于ipad1
| 在ipad1和ipad2上测试NEON指令时,我注意到ipad2上的代码几乎没有加快速度,因为ipad2上的大多数功能实际上比ipad1上运行得快得多。 这是针对诸如VMUL,VLD1,VADD和VSUB等指令的,使用诸如q0之类的四字寄存器进行FFT等操作。 此外,我注意到苹果自己的FFT函数vdsp_fft_zrip也无法为ipad2加速。 所以问题是,对于四字SIMD类型的指令,ipad2 NEON的执行速度是否比ipad1 NEON引擎快?解决方法
与核心的其余部分相比,A4上的NEON单元异常强大。 A5的其余核心与A4相比有很大改进,但NEON单元的性能几乎没有变化。您正在观察的是预期的。
当然,现在有两个核心,因此,如果您可以同时使用这两个核心,则仍然可以看到明显的加速。而且,A5的双精度计算已从A4进行了很大改进,因为它已经完全流水线化。
, 即使在最近推出的64位ARM上,NEON也会保持相当长的一段时间。
NEON不能从提高时钟速度中受益匪浅。 NEON已经非常快,以至于它花费大部分函数执行时间来等待内存中的数据。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。