使用范围与 lambda 内联初始化的向量初始化

如何解决使用范围与 lambda 内联初始化的向量初始化

我想通过转换另一个向量来初始化一个向量。我使用两种内联初始化方式进行了测试，即转换后的 std::vector。

一个使用 lambda 内联初始化（使用 std::transform）：

   std::vector<int> foo(100,42);
   const auto fooTimesTwo = [&]{
            std::vector<int> tmp(foo.size());
            std::transform(foo.begin(),foo.end(),tmp.begin(),convert);
            return tmp;
    }();

另一个 - 使用 std::ranges::views::transform：

   std::vector<int> foo(100,42);
   auto transform_range = (foo | std::ranges::views::transform(convert));
   std::vector<int> fooTimesTwo {
           transform_range.begin(),transform_range.end()
   };

我预计两种向量初始化方式应该具有相似的性能，但由于某种原因，传统 std::transform 解决方案的基准测试比第二个方法快得多（快 9.7 倍 -> https://quick-bench.com/q/3PSDRO9UbMNunUpdWGNShF49WlQ ） .

我的问题是：

我是否错误地使用了 std::ranges::views::transform？
为什么它的运行速度这么慢？

旁注 - 可以使用 boost::make_transform_iterator 来完成，但我无法在 quick-bench 上检查它，因为它们不支持 boost。所以我不确定这种解决方案的效率。

解决方法

为什么它运行得这么慢？

您遇到的问题是 C++98/C++17 迭代器模型和 C++20 迭代器模型之间的差异之一。 X 作为前向迭代器 was 的旧要求之一：

如果 X 是可变迭代器，则 reference 是对 T 的引用；如果 X 是常量迭代器，则 reference 是对 const T 的引用，

也就是说，迭代器的 reference 类型必须是一个真正的引用。它不能是代理引用或纯右值。任何 reference 是纯右值的迭代器自动只是一个输入迭代器。

C++20 中没有这样的要求。

因此，如果您查看 foo | std::ranges::views::transform(convert)，这是一个纯右值 int 的范围。在 C++20 迭代器模型中，这是一个随机访问范围。但是在 C++17 中，因为我们处理的是纯右值，所以这只是一个输入范围。

vector 的迭代器对构造函数不是基于 C++20 迭代器模型，而是基于 C++98/C++17 迭代器模型。它使用迭代器类别的旧理解，而不是新理解。并且 C++20 范围适配器非常努力地确保它们对旧的迭代器模型做“正确的事情”。当检查为 C++20 时，我们改编的范围确实将自己正确地宣传为随机访问，并在检查为 C++17 时输入：

void f(std::vector<int> v) {
    auto r = v | std::views::transform(convert);
    using R = decltype(r);
    static_assert(std::ranges::random_access_range<R>);
    static_assert(std::same_as<std::input_iterator_tag,std::iterator_traits<std::ranges::iterator_t<R>>::iterator_category>);
}

那么当您将两个输入迭代器传递给 vector 的迭代器对构造函数时会发生什么？好吧，它不能预先分配一个巨大的块（我们不能在这里做 last - first 因为它是一个输入迭代器，具有“大小哨兵”可能独立于遍历类别的概念也是一个新的C++20 迭代器模型中的东西）......相反，它基本上是这样做的：

for (; first != last; ++first) {
    push_back(*first);
}

对于输入迭代器来说，没有比这更好的了。但这非常低效，因为我们最终会进行八次分配而不是一次分配。

在 range-v3 中，您可以这样做：

auto result = foo | ranges::views::transform(convert)
                  | ranges::to<std::vector>();

to 算法了解 C++20 迭代器模型，并通过在此处提前保留来做正确的事情。然而，to 是非常有限的，因为它是一个外部库，我们不能仅仅修改标准库类型来选择它。我们希望在 C++23 中有一个 std::ranges::to，它会对标准库容器进行改进，以更好地做到这一点。到那时，此解决方案将比您的原始解决方案更好，因为 std::vector<int> foo(tmp.size()) 本身是一种浪费，必须将一块内存零初始化，然后立即覆盖它。

与此同时，我确实想知道保留这个 reference-must-be-reference 要求的一般价值（很少有人知道，也可能更少人依赖：最大的价值可能只是知道 operator->() 可以返回 &operator*()？）。

std::vector<bool> 已经在这方面撒谎，并宣称自己是一个随机访问 C++17 范围，例如。

标准库实现应该能够更好地处理这种情况。他们应该能够安全地检查 C++20 迭代器概念并因此做一些智能的事情。在这种情况下，我们有 C++20 随机访问迭代器，因此vector应该能够在这种情况下有效地构建自身。已提交 100070。

使用范围与 lambda 内联初始化的向量初始化

如何解决使用范围与 lambda 内联初始化的向量初始化

解决方法

相关推荐