如何解决为什么在 C 中迭代这样的数组效率低下?
我正在读一本书,里面有这一段:
C 中的数组可以看作是一块连续的内存。更多的 准确地说,数组的最后一维是连续部分。我们 将此称为行主顺序。了解这一点以及一个事实 访问时缓存故障将完整的缓存行加载到缓存中 未缓存数据以防止后续缓存故障,我们可以看到原因 使用 array[0][0] 访问维度为 10000x10000 的数组将 可能在缓存中加载数组 [0][1],但访问数组 [1][0] 是正确的 after 会产生第二个缓存错误,因为它是 sizeof(type)*10000 字节远离数组[0][0],因此 当然不在同一个缓存行上。这就是为什么像这样迭代 效率低下:
#define ARRLEN 10000
int array[ARRLEN][ARRLEN];
size_t i,j;
for (i = 0; i < ARRLEN; ++i)
{
for(j = 0; j < ARRLEN; ++j)
{
array[j][i] = 0;
}
}
您能否向我解释一下他们在本段中试图解释的内容以及他们谈论的“缓存故障”是什么?
解决方法
把数组想象成一本书的页面。如果每页包含 1024 个字符,那么声明为 a[100][1024]
的数组就像一本 100 页的书。通过阅读每一页来阅读本书更有效。也就是说,您按照 a[0][0]、a[0][1]、...、a[0][1023]、a[1][0] 的顺序进行迭代。即,您阅读整页,然后翻页。如果您遍历最左边的索引,就像从每一页读取一个字符,在读取一个字符后翻页,然后在阅读完本书的末尾时返回到第 1 页以读取第二个字符。翻页是缓存错误。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。