如何解决超越指令级并行的架构改进
在学习了计算机架构课程之后,似乎所有架构级别的性能提升都来自于利用并行性,而且目前正在推动行业发展的是 DSA,他们也“仅”以更量身定制的方式利用并行性。
然而,加速受到 Amdhal 定律的限制。因此,即使是拥有无限资源、完美的分支预测器且不会因数据危险而停顿的超标量处理器,也只能实现如此大的加速。
问题是:
可以找到多少 ILP? 是否可以在软件级别编写完全并行的程序?如果不是为什么不可以实现最大并行度? 最后我想知道是否存在 ILP 之外的其他范式。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。