微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

为什么 movaps 会导致分段错误?

如何解决为什么 movaps 会导致分段错误?

简介

我试图让自己熟悉 AES 指令,然后使用能够更自觉地利用这些技术的库。然而,我不经常用汇编编程,所以我对这门语言有一些信心,但我不认为自己是专家。我已经编写了大约 150 条装配线的清单,以尝试使用英特尔提供的文档来使用这些功能。然而,我并没有成功地向前迈出很多步。

当我使用指令 movaps 时,由于主程序中的分段错误导致程序崩溃。我已经尝试使用 gdb 和 valgrind 进行调试,但似乎一切都应该正常工作,但事实并非如此。以下是导致问题的行。

代码

main:
start_f

    printstr

    movaps (string),%xmm15
==> movaps (key),%xmm0
    call   aes_encript

    movaps %xmm15,string
    printstr

end_f

start_fend_f 只是用于启动和结束函数的宏。我还提供了 .data 部分的代码显示应该没有问题:

    .data
string:
    .string "string"
    .fill   (128 - (.-string)),1,0

newline:
    .byte   0x0a

key:
    .fill   128,0

    .text
    .global _start

调试信息

至于错误,无论是通过静态反汇编还是在gdb中,我都无法获得任何有用的信息。 Valgrind 也没有帮助,这是意料之中的,因为我根本不接触堆。 我在 gdb 中展示了主要反汇编的部分清单:

   0x0000000000401022 <+0>:     push   %rbp
   0x0000000000401023 <+1>:     mov    %rsp,%rbp
   0x0000000000401026 <+4>:     mov    $0x402000,%rsi
   0x000000000040102d <+11>:    call   0x401156 <write_long>
   0x0000000000401032 <+16>:    mov    $0x1,%rax
   0x0000000000401039 <+23>:    mov    $0x1,%rbp
   0x0000000000401040 <+30>:    mov    $0x402080,%rsi
   0x0000000000401047 <+37>:    mov    $0x1,%rdx
   0x000000000040104e <+44>:    syscall 
   0x0000000000401050 <+46>:    movaps 0x402000,%xmm15
=> 0x0000000000401059 <+55>:    movaps 0x402081,%xmm0
   0x0000000000401061 <+63>:    call   0x4010b6 <aes_encript>
   0x0000000000401066 <+68>:    movaps %xmm15,0x402000
   0x000000000040106f <+77>:    mov    $0x402000,%rsi
   0x0000000000401076 <+84>:    call   0x401156 <write_long>

这里是地址 0x402081内容(完全可以访问):

(gdb) x/32x 0x402081
0x402081:       0x00000000      0x00000000      0x00000000      0x00000000
0x402091:       0x00000000      0x00000000      0x00000000      0x00000000
0x4020a1:       0x00000000      0x00000000      0x00000000      0x00000000
0x4020b1:       0x00000000      0x00000000      0x00000000      0x00000000
0x4020c1:       0x00000000      0x00000000      0x00000000      0x00000000
0x4020d1:       0x00000000      0x00000000      0x00000000      0x00000000
0x4020e1:       0x00000000      0x00000000      0x00000000      0x00000000
0x4020f1:       0x00000000      0x00000000      0x00000000      0x00000000

请求

我不排除这个错误是愚蠢的小事:我已经有一段时间没有使用了。无论如何,如果你能给我一个小费,我将不胜感激。

如果您想自己尝试此代码,这里有一个包含整个列表的粘贴箱:https://paste.debian.net/1194986/

解决方法

0x402081

key 内存地址未与 16 字节对齐。

来自Intel® 64 and IA-32 architectures software developer’s manualMOVAPS specification

MOVAPS——移动对齐压缩的单精度浮点值
...
当源或目标操作数是内存操作数时,操作数必须按 16 字节(128 位)对齐 版本)、32 字节(VEX.256 编码版本)或 64 字节(EVEX.512 编码版本)边界或一般保护异常 (#GP) 将生成。

您可以使用 movups,但通常最好对齐您的常量。

在上一行中,0x402000 对齐到 16 个字节,因此上一行不会出现段错误。

key 可以定义如下以对齐 16 个字节:

    .balign 16
key:
    .fill   128,1,0

另请注意,这是 128 个字节的零,而不是 128 位。由于它全为零,你可以把它放在 .bss 而不是 .data

(把newline: .byte '\n' 放在之后,这样你就不会在对齐上浪费15个字节。或者更好的是,把换行符放在.rodata中,或者有write_long在它写入的输出中包含一个换行符。)

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。