前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >性能大杀器:c++中的copy elision

性能大杀器:c++中的copy elision

作者头像
高性能架构探索
发布2024-04-23 17:41:52
1490
发布2024-04-23 17:41:52
举报
文章被收录于专栏:技术随笔心得

我们简单的介绍了下移动语义,今天聊聊编译器的一个常见优化拷贝消除(copy elision)

move和copy elision是一种常见的编译器优化技术,旨在避免不必要的临时对象的复制和拷贝,对于那种占用资源比较多的对象来说,这种优化无疑会很大程度上提升性能。

且看一个例子,如下:

代码语言:javascript
复制
#include <iostream>

struct Obj {
    

    Obj() {
       std::cout << "Default ctor" << std::endl;
    }

    Obj(const Obj& r) {
        std::cout << "Copy ctor" << std::endl;
    }
   
    int x_ = 0;
};

Obj CreateObj1() {
    return Obj();
}

Obj CreateObj2() {
    Obj temp;
    temp.x_ = 42;
    return temp;
}

int main() {
    Obj o1(CreateObj1());
    Obj o2(CreateObj2());
   
    return 0;
}

编译并运行上述代码,输出:

代码语言:javascript
复制
Default ctor
Default ctor

PS:本文中所使用的编译器及版本为gcc 11.4.0,如果未做显式说明,在编译过程中都加上-std=c++11选项。

好了,仍然是上面的代码,如果编译选项变成-std=c++11 -fno-elide-constructors,输出试试,看看会是什么结果~~

emm,在本地尝试编译并运行了下:

代码语言:javascript
复制
Default ctor
Copy ctor
Copy ctor
Default ctor
Copy ctor
Copy ctor

与最开始的输出相比,多了很多,现在我们着手分析下原因,以Obj o1(CreateObj1());为例:

•调用CreateObj1()函数,创建一个临时对象并返回,此时会输出Default ctor•将上述的需要返回的临时对象以拷贝方式赋值给函数返回值,此时会输出Copy ctor•函数返回值作为obj1的拷贝对象,此时会输出Copy ctor

接着分析下Obj o2(CreateObj2());:

•CreateObj2()创建一个临时变量temp,此时会输出Default ctor•修改临时变量temp的成员变量x_的值为2•temp以拷贝方式赋值给函数返回值,此时会输出Copy ctor•函数返回值作为obj2的拷贝对象,此时会输出Copy ctor

对前面的输出做个简单总结,如下:

代码语言:javascript
复制
Default ctor // 在CreateObj1中以Obj()方式创建临时变量T1
Copy ctor    // T1以复制拷贝的方式赋值给CreateObj1()函数返回值,此处假设为T2
Copy ctor    // 通过调用拷贝构造函数,将T2值赋值给o1
Default ctor // 创建临时变量temp
Copy ctor    // temp以复制拷贝的方式赋值给CreateObj1()函数返回值,此处假设为temp2
Copy ctor    // 通过调用拷贝构造函数,将temp2值赋值给o2

在上一节中,我们提到过,可以通过使用移动构造的方式来避免拷贝,为了测试该功能,尝试在Obj类中新增一个移动构造函数:

代码语言:javascript
复制
#include <iostream>

struct Obj {
    Obj() {
       std::cout << "Default ctor" << std::endl;
    }

    Obj(const Obj& r) {
        std::cout << "Copy ctor" << std::endl;
    }
    
    Obj(const Obj&& r) { // 移动构造函数
        std::cout << "Move ctor" << std::endl;
    }
    
    int x_ = 0;
};

Obj CreateObj1() {
    return Obj();
}

Obj CreateObj2() {
    Obj temp;
    temp.x_ = 42;
    return temp;
}

int main() {
    Obj o1(CreateObj1());
    Obj o2(CreateObj2());
   
    return 0;
}

输出如下(编译选项为-std=c++11 -fno-elide-constructors):

代码语言:javascript
复制
Default ctor
Move ctor
Move ctor
Default ctor
Move ctor
Move ctor

看了上述输出,不禁奇怪,为什么在CreateObj2()函数中,创建的temp明明是一个左值,此处却调用的是移动构造即当做右值使用呢?,我们不妨看看标准对此处的解释:

in a return statement in a function with a class return type, when the expression is the name of a non-volatile automatic object (other than a function parameter or a variable introduced by the exception-declaration of a handler (14.4)) with the same type (ignoring cv-qualification) as the function return type, the copy/move operation can be omitted by constructing the automatic object directly into the function call’s return object

意思是当返回语句中的表达式是一个非volatile的命名对象,其类型与函数的返回类型相同时,编译器可以优化掉拷贝或移动操作,直接将自动对象构造到函数调用的返回对象中。

这意味着,当函数返回一个自动对象时,编译器可以优化掉不必要的拷贝或移动操作,直接将自动对象构造到函数调用的返回对象中,以提高效率。这种优化在 C++ 标准中被明确规定,以支持更高效的代码生成。

标准的这一规定,使得原本不支持拷贝的对象,作为函数返回值时,也成了可能。

众所周知,std::unique_ptr<>不支持拷贝操作,即:

代码语言:javascript
复制
std::unique_ptr<int> p1 = std::make_unique<int>(1);
std::unique_ptr<int> p2 = p1;

上述代码将编译失败,错误提示如下:

代码语言:javascript
复制
error: use of deleted function 'std::unique_ptr<_Tp, _Dp>::unique_ptr(const std::unique_ptr<_Tp, _Dp>&) [with _Tp = int; _Dp = std::default_delete<int>]'
    std::unique_ptr<int> p2 = p1;
note: declared here
  unique_ptr(const unique_ptr&) = delete;

那么,如果将其作为函数返回值呢?

代码语言:javascript
复制
std::unique_ptr<int> CreateUnique() {
    auto ptr = std::make_unique<int>(0);
    return ptr;
}

int main() {
  CreateUnique();
  return 0;
}

编译正确,进一步证明了我们前面的说法。

好了,如果我们在编译选项中去掉-fno-elide-constructors,那么输出如下:

代码语言:javascript
复制
Default ctor
Default ctor

通过这个输出,可以看出,编译器忽略了拷贝构造函数的调用,而是直接构造o1和o2对象,这种方式在性能上有了很大的提升,编译器对o1和o2的这种优化方式称为RVONRVO

现在,我们仔细回想下前面的示例代码,在编译的时候,都加上了-std=c++11这个选项,这是因为笔者的gcc11.4默认情况下是用的c++17,而c++17是能够保证RVO优化的,单独对NRVO则不能保证。

如果使用g++ test.cc -o test编译并运行代码,输出:

代码语言:javascript
复制
Default ctor
Default ctor
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-04-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 高性能架构探索 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档