如何解决如果在较低级别内存增加/降低速度,程序中函数/方法的位置是否重要?
假设我编写了一个包含许多函数/方法的程序。在这个程序中,与其他函数相比,某些函数被多次使用。 在这种情况下,函数/方法的定位在改变较低级别(内存)的速度方面是否重要。
目前,我正在学习计算机组织和体系结构,所以这个疑问出现在我的脑海中。
解决方法
RAM 本身是“平坦的”,在任何地址上的性能都相同(除了多插槽机器中的 NUMA 本地内存与远程内存,或者单个插槽上的混合大小的 DIMM 导致仅部分双通道优势1).
i-cache 和 iTLB 局部性会有所不同,因此即使您不只是内联它们,将“热门”函数组合在一起也很有用。
局部性对于从磁盘输入代码的需求分页也很重要:如果可执行文件的整个块是“冷的”,例如仅用于错误处理,程序启动不必等待它从磁盘获取页面错误(或者甚至是软页面错误,如果它在操作系统的页面缓存中很热)。类似地,将“启动”代码分组到一个页面中可以让操作系统稍后在不再需要它时删除该“干净”页面,从而释放物理内存以进行更多缓存。
像 GCC 这样的编译器会这样做,将 _start
之类的 CRT 启动代码(最终调用 main
)放入相同程序段中的 .init
部分(由程序加载器映射) .text
和 .fini
,只是为了将启动代码组合在一起。任何 C++ 非常量静态初始化函数也将进入该部分。
脚注 1:通常; IIRC 有一个 4G 和一个 8G 内存条的计算机可以为前 8GB 物理地址空间运行双通道,但后 4 个只能运行单通道,因此内存带宽减半。我认为一些现实生活中的英特尔芯片组/CPU 内存控制器就是这样。
但除非您正在制作嵌入式系统,否则您不会选择操作系统在物理内存中加载您的程序的位置。对于计算机来说,在多通道内存控制器上使用匹配的内存也更为正常,这样整个内存范围就可以在通道之间交错。
顺便说一句,位置对 DRAM 本身很重要:它在行/列设置中布局,切换行需要额外的 DDR 控制器命令,而不是仅读取同一打开“页面”中的另一列。 DRAM 页面与虚拟内存页面不同。一个 DRAM 页面是同一通道上同一行的内存,通常为 2kiB。有关 DDR DRAM 的更多详细信息,以及有关缓存和内存布局的一些非常好的内容,请参阅 What Every Programmer Should Know About Memory?。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。