如何解决矩阵乘法的高效实现ARM cortex A9 - Xilinx SDK
是否有任何简单的方法库可以使用 Xilinx SDK 在 ARM CortexA9 双核上高效(最大可能的速度)实现线性代数?
我正在使用带有双核 Arm 处理器的 zybo z7 开发板,我想在 Xilinx SDK 上实现一个简单的神经网络,其中一个卷积层后跟一个密集层。具体来说,在 Arm 上传输基于 python numpy 的模型。我阅读了一些 ARM 和 SIMD 库的手册,但我不想深入研究。
对我来说,一个简单的方法是使用一个库并像 python 中的 numpy 一样自行执行乘法/点积/卷积等(快速),并避免纯 for...循环语法。举个例子就好了!
感谢您的时间
解决方法
您可以尝试使用 Tensorflow 使用的 Eigen 库来实现矩阵计算,或者您甚至可以尝试使用已经在 ARM-Cortex M 系列处理器上测试过的 TensorFlow lite。
>版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。