栈上数据的对齐方式是什么？

如何解决栈上数据的对齐方式是什么？

我阅读了 K&R C(2nd) 185p，其中一部分很难理解。

尽管机器各不相同，但对于每台机器都有一个最严格的类型：如果最严格的类型可以存储在特定地址，那么所有其他类型也可能是。在某些机器上，最严格的类型是 double；在其他情况下，int 或 long 就足够了。

我觉得
大多数现代计算机都是字节寻址的（通过维基）。最小的数据类型char 足以适应任何堆栈区域。所以所有的数据类型都适合任意堆栈位置。但是为什么会存在这样的限制呢？

在this类似的问题中，

CPU 通常要求（或者更有效地工作，如果）某些类型的数据存储在某个（二的幂）值的倍数的地址处。

这解释了我的问题。但我无法理解。这是否意味着堆栈中某些 2 的幂 (2,4,8,16,...,1024,2048,...) 的地址需要某些类型？
如果是这样，为什么？或者如果我错了，它指的是什么？

解决方法

对齐数据有两个原因：

硬件要求。如果正确对齐，某些机器只能访问内存中的数据。当然，您可以执行多次读取并使用一些位算术来模拟从任何地址读取，但这会对性能造成破坏。
性能。即使机器可以访问任何地址的任何数据，如果数据适当对齐，它的性能可能会更好。

当然，这可能因机器而异，但“适当对齐”通常意味着 N 位数据的地址可以被 N/8 整除。

因此，在对齐很重要的机器上，32 位 int 将放置在可被 4 整除的内存地址处，64 位指针将放置在可被 8 整除的内存地址处，等等。

你可以在结构中看到这一点。

#include <stdint.h>
#include <stdio.h>

typedef struct {
   uint32_t u32;
   void*    p;
   uint8_t  u8;
} Struct;

int main(void) {
   Struct s;
   printf("%p\n",(void*)&s.u32);
   printf("%p\n",(void*)&s.p);
   printf("%p\n",(void*)&s.u8);
   printf("%p\n",(void*)(&s+1));
   printf("0x%zx\n",sizeof(s));
}

$ gcc -Wall -Wextra -pedantic a.c -o a && ./a
0x7ffef5f775d0
0x7ffef5f775d8
0x7ffef5f775e0
0x7ffef5f775e8
0x18

这意味着我们有这个：

 0 1 2 3 4 5 6 7 8 9 a b c d e f 0 1 2 3 4 5 6 7
+-------+-------+---------------+-+-------------+ 
| u32   |XXXXXXX| p             |*|XXXXXXXXXXXXX|   * = u8 
+-------+-------+---------------+-+-------------+   X = unused

注意 u32 和 p 之间浪费的空间。这样 p 就正确对齐了。

还要注意 u8 之后浪费的空间。这样当你有一个数组时，结构本身就会正确对齐。如果没有这个最终填充，数组第二个元素的 u32 和 p 将无法正确对齐。

最后，注意使用

typedef struct {
   uint32_t u32;
   uint8_t  u8;
   void*    p;
} Struct;

会导致更小的结构。

 0 1 2 3 4 5 6 7 8 9 a b c d e f 
+-------+-+-----+---------------+
| u32   |*|XXXXX| p             |   * = u8 
+-------+-+-----+---------------+   X = unused

栈上数据的对齐方式是什么？

如何解决栈上数据的对齐方式是什么？

解决方法

相关推荐