微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

是否可以以不会导致 UB 的方式分配未初始化的数组?

如何解决是否可以以不会导致 UB 的方式分配未初始化的数组?

在 C++ 中实现某些数据结构时,需要能够创建一个包含未初始化元素的数组。正因为如此,有

buffer = new T[capacity];

不合适,因为 new T[capacity] 初始化数组元素,这并不总是可行的(如果 T 没有认构造函数)或期望的(因为构造对象可能需要时间)。典型的解决方案是分配内存并使用placement new。

为此,如果我们知道元素的数量是已知的(或者至少我们有一个上限)并在堆栈上分配,那么据我所知,可以使用对齐的字节或字符数组,然后使用 std::launder 访问成员。

alignas(T) std::byte buffer[capacity];

但是,它只解决了栈分配的问题,并没有解决堆分配的问题。为此,我假设需要使用对齐的新,并编写如下内容

auto memory =  ::operator new(sizeof(T) * capacity,std::align_val_t{alignof(T)});

然后将其转换为 std::byte*unsigned char*T*

// not sure what the right type for reinterpret cast should be
buffer = reinterpret_cast(memory);

但是,有几件事我不清楚。

  1. 如果 ptr 指向可与 T 进行指针互转换的对象,则结果 reinterpret_cast<T*>(ptr) 被定义。有关详细信息,请参阅 this answerhttps://eel.is/c++draft/basic.types#basic.compound-3。我认为,将其转换为 T* 是无效的,因为 T 不一定与 new 的结果是指针可互转换的。但是,对于 char*std::byte 是否有明确定义?
  2. 当将 new 的结果转换为有效的指针类型(假设它不是实现定义的)时,它是否被视为指向数组第一个元素的指针,或者只是指向单个对象的指针?虽然,据我所知,在实践中很少(如果有的话)很重要,但存在语义差异,仅当指向的元素是数组成员并且结果为 pointer_type + integer的算术指向另一个数组元素。 (见https://eel.is/c++draft/expr.add#4)。
  3. 就生命周期而言,数组unsigned charstd::byte 类型的对象可以为new (https://eel.is/c++draft/basic.memobj#intro.object-3) 的放置结果提供存储,但是它是否为其他类型的数组定义?
  4. 据我所知,T::operator newT::operator new[] 表达式在幕后调用 ::operator new::operator new[]。既然内置 new 的结果是 void,那么如何转换为正确的类型呢?这些是基于实现还是我们有明确定义的规则来处理这些?
  5. 释放内存时,应该使用
::operator delete(static_cast<void*>(buffer),sizeof(T) * capacity,std::align_val_t{alignof(T)});

或者有其他方法吗?

PS:我可能会在实际代码中将标准库用于这些目的,但我试图了解幕后的工作原理。

谢谢。

解决方法

指针相互转换

关于指针相互转换,使用 T *{[unsigned] char|std::byte} * 都没有关系。无论如何,您必须将其转换为 T * 才能使用它。

请注意,您必须调用 std::launder(根据转换的结果)来访问指向的 T 对象。唯一的例外是创建对象的placement-new 调用,因为它们还不存在。手动析构函数调用不是例外。

如果您不使用 std::launder,则缺少指针可相互转换只会是一个问题。

当将 new 的结果转换为有效的指针类型时(假设它不是实现定义的),它是否被视为指向数组第一个元素的指针,或者只是指向单个对象的指针?

如果您想更加安全,请在执行任何指针运算后将指针存储为 {[unsigned] char|std::byte} *reinterpret_cast

类型为数组 unsigned charstd::byte 的对象可以为放置 new 的结果提供存储

该标准并没有说任何地方都需要“提供存储”才能让新安置工作发挥作用。我认为该术语的定义仅用于标准中其他术语的定义。

考虑[basic.life]/example-2,其中operator= 使用placement-new 就地重建对象,即使类型T 不为相同类型T“提供存储” .

既然内置 new 的结果是 void,那么如何转换为正确的类型?

不确定标准对此有何规定,但除了 reinterpret_cast 之外还有什么?

释放内存

你的方法看起来是正确的,但我think你没有传递大小。

,

我认为您的前提可能不正确。如果 T 是一个类,则应调用默认构造函数。但是,这可能是空白的,如果您的类包含所有 POD(纯旧数据),则不会初始化任何内容。实际上,我一直都依赖于此,因为出于性能原因,我通常不希望初始化某些内容。

我相信对于全局数据等有一些警告,其中有些东西是零初始化的。但通常堆的东西不是。你可以测试它,你会发现内存中有一堆垃圾,至少在发布模式下编译时是这样。一些编译器会在调试模式下初始化内存,但这是在构造函数之外完成的。

例如,您可以在自定义放置新函数中设置数据,如果它是 POD,它仍将存在于构造函数中。有些人会说这是 UB,但我认为标准对 POD 说“什么也没做”,这意味着没有初始化。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。