如何解决分支与内存访问 - 在 AArch64 模式下通常更喜欢什么?
在 Cortex-A 处理器(AArch64 模式)上是否有一些优化速度的经验法则?就像从内存中读取总是比分支更好?
以最简单的十六进制字符串转换为例:
convert:
. . .
cmp x9,9
b.le . + 8
add x9,x9,0x07
add x9,0x30
strb w9,[x10,-1]!
. . .
b convert
对比
convert:
. . .
ldrb w9,[x11,x9] ; x11 - ptr to alphabet string: "0123456789ABCDEF"
strb w9,-1]!
. . .
b convert
预先感谢您提供任何提示。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。