如何解决如何获得 AWS Graviton 2 实例 (c6g.16xlarge) 的单精度理论峰值性能?
我正在尝试计算 AWS Graviton 2 的理论峰值性能。 基于 this post,我似乎需要类似(以 GHz 为单位的 cpu 速度)x(每个周期的 cpu 指令)x(物理内核数)之类的东西。
对于最后一个数字,lscpu
的输出显示 64 个内核,每个内核 1 个线程:
$ lscpu
...
Thread(s) per core: 1
Core(s) per socket: 64
...
BogoMIPS: 243.75
我仍然需要找到一种方法来检索时钟速度和每个时钟的指令(对于单精度)。这是否以编程方式完成,或者是否可以在某些文档中找到信息,对我来说并不重要。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。