微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

ios – 我怎样才能将这个for循环向量化?

我有这个循环

void f1(unsigned char *data,unsigned int size) {
    unsigned int A[256] = {0u};      
    for (register unsigned int i = 0u; i < size; i++) {
        ++A[data[i]];
    }
   ...

有没有办法手动矢量化?

解决方法

由于data [i]中的多个条目可能包含相同的值,因此我不知道如何将其简化为矢量化,因为可能存在竞争条件.矢量化的要点是每个元素独立于其他元素,因此可以并行计算.但是你的算法不允许这样做. “Vectorize”与“让自己走得更快”不是一回事.

在这里构建的是一个直方图,iOS内置了优化的支持.您可以创建单通道单行图像,并使用vImageHistogramCalculation_Planar8,如下所示:

void f1(unsigned char *data,unsigned int size) {
    unsigned long A[256] = {0u};

    vImage_Buffer src = { data,1,size,size };
    vImage_Error err = vImageHistogramCalculation_Planar8(&src,A,kvImageDoNottile);
    if (err != kvImageNoError) {
        // error
    }
    ...
}

但是要小心,假设这总是一场胜利.这取决于您的数据大小.进行函数调用非常昂贵,因此可能需要数百万字节的数据才能使其值得.如果你在较小的集合上计算它,那么一个简单的,编译器优化的循环通常是最好的方法.您需要在真实设备上对此进行分析,以确定哪个更快.

只需确保允许编译器通过启用-Ofast(Fastest,Aggressive)来应用所有矢量化优化.在这种情况下,这无关紧要,因为你的循环不能简单地进行矢量化.但通常,-Ofast允许编译器在可能略微增加代码大小的情况下应用矢量化优化(在认的-Os下不允许). -Ofast还允许在执行浮点数学时有点邋so,所以不应该在需要严格的IEEE浮点一致性的情况下使用(但对于iOS应用来说几乎不是这种情况,所以-Ofast几乎总是正确的设置).

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐