微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

处理器加速计算差异

如何解决处理器加速计算差异

我想了解为什么阿姆达尔定律不适用于这种情况?

假设我们有两个配置

配置 1 的 L1 访问延迟(hitDelay 和 missDelay 为 1 个周期)配置 2 的 L1 访问延迟为 7 个周期。

假设加载和存储占处理器时间的 30%,我们预计速度会提高 1/(0.7 + 0.3/7) = 1.35

然而,当我在模拟基于 ROB 的处理器的实际模拟器上运行这两种配置并使用周期计算加速时,加速为 1.12。

为什么加速与使用阿姆达尔定律计算的不同。我在想 Amdahl 定律由于某种原因不适用?

解决方法

Amdahl 的“定律”假设不同部分的时间不重叠。

乱序执行的 ROB 的全部意义在于找到指令级并行性并隐藏延迟。这就是为什么整个指令序列的性能不是每个指令单独的任何单个“成本”数字的总和,除了在最简单的 CPU 上。

例如What considerations go into predicting latency for operations on modern superscalar processors and how can I calculate them by hand?(现代 x86 使其变得更加复杂,因为每条指令可能在 uops 中具有不同的前端成本,但即使使用更简单的 RISC 机器,您仍然面临后端端口压力与. 可能的延迟瓶颈)。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。