不要被C++“自动生成”所蒙骗

不要被C++自动生成”所蒙骗

 

C++对象可以使用两种方式进行创建:构造函数和复制构造函数。假如我们定义了类A,并使用它创建对象。

A a,b;
A c=a;
A d(b);

对象ab使用编译器提供的认构造函数A::A()创建出来,我们称这种创建方式为对象的定义(包含声明的含义)。对象cd则是使用已有的对象,通过编译器提供的复制构造函数A::A(const A&)创建,我们称这种创建方式为对象的初始化(包含定义和声明的含义)。

可能不少人会把对象的初始化和对象的赋值混淆,比如。

c=d;

这里把对象d赋值给对象c并非创建新的对象,它不会调用任何构造函数。编译器认提供的赋值运算符重载函数const A&operator=(const A&)为该语句提供支持

编译器除了提供认构造函数、复制构造函数和赋值运算符重载函数之外,有可能还为我们提供了析构函数A::~A(),但是这里的析构函数并不是virtual的(相信会有童鞋忘记这一点)。

这些基础的语法对学习过C++的人或许并不陌生,我们自从学习了面向对象C++后,一直都知道编译器为我们提供了这样的便利条件。经过多年的编程实践和体验,我们绝对相信编译器的确为我们做了这些工作,因为我们没有遇到过任何问题。甚至我们脑子中会认形成一个概念——即使我定义了一个空类(类内什么都没有),编译器依然会“乖乖的”为我们生成上边所说的四个函数

如果你真的形成了这种观念的话,那么恭喜你,因为你已经将C++基本规则运用的十分熟练了。同时遗憾的是你我都看到了冰山一角,编译器的工作方式远不像我们使用它的那样。读者可能会疑问,难道编译器没有生成这些函数吗?答:要看你类的定义。那么编译器到底如何生成这些函数呢?和我一样又好奇心的人都想一探究竟,而这些内容在《Inside The C++ Object Model》被诠释的比较彻底。笔者也通过“借花献佛”的方式将该书所描述的对象构造的内幕结合个人的理解和大家一起分享

首先我们从最简单的谈起,编译器为类生成构造函数了吗?如果按照上边描述的例子,只有一个空的类定义的话,我们可以肯定的说——没有。对编译器这样的做法,我们不必感到惊讶。试想一个空的类——没有数据成员,没有成员函数,即使生成了构造函数又能做什么呢?即便是生成了,也只是一个空构造函数而已。

A(){}

它什么也做不了,也什么都不必做。更“悲剧”,它的出现不仅没有任何积极意义,还会为编译器和程序运行增加完全不必要的函数调用负担。

既然如此,我们让这个类再复杂一点,我们为它增加数据成员和成员函数,比如下边这段代码(我们记它为例子1)。

class A
{
public:
       int var;
       void fun(){}
};

即便如此,结果还是和上边的一样,不生成构造函数!因为没有任何理由对var初始化,况且编译器也不知道用什么值给它初始化。

果然,在主函数内定义对象a后,没有任何构造函数调用

有人可能会说用0初始化不行吗?这只是我们的“一厢情愿”而已。一个没有初始化的变量本身的值就可以是不确定的,何必要生成一个没有任何意义的初始化为0的语句呢。

编译器到底怎样才能生成构造函数呢?!或许你和我一样有点“抓狂”了。不过现在还不是绝望的时候,因为编译器需要我们给它一个“正当的理由”生成构造函数。有四个正当的理由,让编译器不得不生成构造函数,这里一一介绍。

首先,我们修改一下var的类型。这里假设它不是内置类型int,而是一个定义好的类B

B var;

修改一下数据成员的类型为自定义类型能影响编译器的抉择吗?答:可能。这要看类B有没有定义构造函数。读者可能有点明白了,是的,如果B没有定义构造函数(和这里的A一个样子),那么编译器仍然没有理由生成构造函数——为B初始化什么呢?反之,B一旦定义了认构造函数B::B(),即便它是空的,编译器就不得不为A创建认构造函数了(这里不考虑编译器的深度优化)。因为A的对象需要用B认构造函数初始化它自己的成员var,虽然B的构造函数什么也没做。因为编译器不能假定B的构造函数做了什么样的操作(极端一点:万一修改一个全局变量了呢?),因此编译器有绝对的必要生成A的构造函数,保证B类型的数据成员的构造函数正常执行。

转到编译器为A生成的构造函数处,我们发现了B的构造函数调用的语句(选中行)。

当然,如果B提供了构造函数,但不是认的构造函数,那么必须要程序员介入为var初始化,否则编译器就不客气了——error

因此,编译器生成认构造函数的第一个正当理由是——类内数据成员是对象,并且该对象的类提供了一个认构造函数

现在,我们回到例子1,这里我们不修改var的类型,而是让A继承于另一个C

class A:public C

我们都知道,在C++构造函数初始化语法中,构造函数会先初始化基类C,再初始化自身的数据成员或者对象。因此,这里的问题和对象成员var类似。如果基类C没有提供任何构造函数,那么编译器仍然不提供A认构造函数。如果C提供了认构造函数,结果和前边类似。

结果不出所料,编译器为A生成了构造函数,并且调用了基类C定义的认构造函数。同样,若C没有提供认构造函数,而提供了其他构造函数,编译是无法通过的。

这也是编译器生成认构造函数的第二个正当理由——类的基类提供了认的构造函数

我们再次回到例子1,这次我们修改成员函数fun

virtual void fun(){}

我们把类A的成员函数fun修改为虚函数,再次看看是否产生了认构造函数

这次编译器“毫不客气”的为A生成认构造函数,虽然它没有调用任何其他的构造函数!这是什么原因呢?原来,C++为了实现多态机制,需要为类维护一个函数表(vftable),而每个该类的对象都保存一个指向该虚函数表的一个指针(一般保存在对象最开始的四个四节处,多态机制的实现这里暂不介绍)。编译器为A生成构造函数,其实不为别的,就为了保证它定义的对象都要正常初始化这个虚函数表的指针(vfptr)!

好了,因此我们得出编译器生成认构造函数的第三个正当理由——类内定义了虚函数。这里可能还涉及一个更复杂点的情况:类内本身没有定义虚函数,但是继承了基类的虚函数。其实按照上述的原则,我们可以推理如下:基类既然定义了虚函数,那么基类本身就需要生成认构造函数初始化它本身的虚函数表指针。而基类一旦产生了认构造函数,派生类就需要产生认构造函数调用它。同时,如果读者对多态机制了解清除的话,派生类在生成认构造函数内还会初始化一次这个虚函数表指针的。

最后,我们再次回到例子1,这次仍然让A继承于C,但是这次C一个空类——什么都没有,也不会自动生成认构造函数。但是A继承C的方式要变化一下。

class A:public virtual C

A虚继承于C,这次又有什么不同呢?

这次编译器也生成A的构造函数,并且初始化过程和虚函数时有点类似。细心观察下发现,这次构造函数也初始化了一张表——vbtable。了解虚继承机制的读者应该不会陌生,这张表叫虚基类表,它记录了类继承的所有的虚基类子对象在本类定义的对象内的偏移位置(至于虚继承机制的实现,我们以后详细探讨)。为了保证虚继承机制的正确工作,对象必须在初始化阶段维护一个指向该表的一个指针,称为虚表指针(vbptr)。编译器因为它提供A认构造函数的理由和虚函数时类似。

这样,我们得出编译器生成认构造函数的第四个正当理由——类使用了虚继承

到这里,我们把编译器为类生成认构造函数的正当理由阐述完毕,相信大家应该对构造函数生成时机有了一个大致的认识。这四种“正当理由”其实是编译器不得不为类生成认构造函数的理由,《Inside The C++ Object Model》里称这种理由为nontrival的(候sir翻译的很别扭,所以怎么翻译随你啦)。除了这四种情况外,编译器称为trival的,也就是没有必要为类生成认构造函数。这里讨论的构造函数生成准则的内容是写进C++Standard的,如此看来标准就是“贴合正常思维”的一套准则(简单YY一下),其实本就是这样,编译器不应该为了一致化做一些没有必要的工作。

通过对认构造函数的讨论,相信大家对复制构造函数、赋值运算符重载函数、析构函数生成时机应该可以自动扩展了。没错,它们遵循着一个最根本的原则:只有编译器不得不为这个类生成函数的时候(nontrival),编译器才会真正的生成

因此,正如标题所说,我们不要被C++语法中所描述的那些条条框框所“蒙骗”了。的确,相信这些生成规则不会对我们的编程带来多大的影响(不会产生错误),但是只有了解它们的背后操作,我们才知道编译器究竟为我们做了什么,我们才知道如何使用C++才能让它变得更有效率——比如消除不必要的构造和虚拟机制等(如果可以的话)。相信本文对C++自动生成内容的描述让不少人认清对象构造函数产生的前因后果,希望本文对你有所帮助。

原文地址:https://www.cnblogs.com/fanzhidongyzby/archive/2013/01/12/2858040.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


对象的传值与返回说起函数,就不免要谈谈函数的参数和返回值。一般的,我们习惯把函数看作一个处理的封装(比如黑箱),而参数和返回值一般对应着处理过程的输入和输出。这种情况下,参数和返回值都是值类型的,也就是说,函数和它的调用者的信息交流方式是用过数据的拷贝来完成,即我们习惯上称呼的“值传递”。但是自从引
从实现装饰者模式中思考C++指针和引用的选择最近在看设计模式的内容,偶然间手痒就写了一个“装饰者”模式的一个实例。该实例来源于风雪涟漪的博客,我对它做了简化。作为一个经典的设计模式,本身并没有太多要说的内容。但是在我尝试使用C++去实现这个模式的实例的时候,出现了一些看似无关紧要但是却引人深思的问题
关于vtordisp知多少?我相信不少人看到这篇文章,多半是来自于对标题中“vtordisp”的好奇。其实这个关键词也是来源于我最近查看对象模型的时候偶然发现的。我是一个喜欢深究问题根源的人(有点牛角尖吧),所以当我第一次发现vtordisp的时候,我也是很自然的把它输进google查找相关资料,但
那些陌生的C++关键字学过程序语言的人相信对关键字并不陌生。偶然间翻起了《C++ Primer》这本书,书中列举了所有C++的关键字。我认真核对了一下,竟然发现有若干个从未使用过的关键字。一时间对一个学了六年C++的自己狠狠鄙视了一番,下决心一定要把它们搞明白!图1红色字体给出的是我个人感觉一般大家
命令行下的树形打印最近在处理代码分析问题时,需要将代码的作用域按照树形结构输出。问题的原型大概是下边这个样子的。图中给了一个简化的代码片段,该代码片段包含5个作用域:全局作用域0、函数fun作用域1、if语句作用域2、else语句作用域3和函数main作用域4。代码作用域有个显著的特点就是具有树形结
虚函数与虚继承寻踪封装、继承、多态是面向对象语言的三大特性,熟悉C++的人对此应该不会有太多异议。C语言提供的struct,顶多算得上对数据的简单封装,而C++的引入把struct“升级”为class,使得面向对象的概念更加强大。继承机制解决了对象复用的问题,然而多重继承又会产生成员冲突的问题,虚继
不要被C++“自动生成”所蒙骗C++对象可以使用两种方式进行创建:构造函数和复制构造函数。假如我们定义了类A,并使用它创建对象。Aa,b;Ac=a;Ad(b);对象a和b使用编译器提供的默认构造函数A::A()创建出来,我们称这种创建方式为对象的定义(包含声明的含义)。对象c和d则是使用已有的对象,
printf背后的故事 说起编程语言,C语言大家再熟悉不过。说起最简单的代码,Helloworld更是众所周知。一条简单的printf语句便可以完成这个简单的功能,可是printf背后到底做了什么事情呢?可能很多人不曾在意,也或许你比我还要好奇!那我们就聊聊printf背后的故事。 一、printf
定义 浮点数就是小数点位置不固定的数,也就是说与定点数不一样,浮点数的小数点后的小数位数可以是任意的,根据IEEE754-1985(也叫IEEE Standard for Binary Floating-Point Arithmetic)的定义,浮点数的类型有两种:单精度类型(用4字节存储)和双精度
在《从汇编看c++的引用和指针》一文中,虽然谈到了引用,但是只是为了将两者进行比较。这里将对引用做进一步的分析。1 引用的实现方式在介绍有关引用的c++书中,很多都说引用只是其引用变量的一个别名。我自己不是很喜欢这种解释,因为觉得这种解释会给人误解,好像引用和变量就是一回事,而且,书中也没有给出,为
今天写程序的时候,创建了一个结构体:struct BufferObj {char* buf;int bufLen;SOCKADDR_STORAGE addr;int addrLen;struct BufferObj* next;};该结构体有一个next指针,本意是这个指针初始的时候应该为NULL,
placement operator new是重载的operator new运算符,它允许我们将对象放到一个指定的内存中。下面来看c++源码:class X {private: int _x;public: X(int xx = 0) : _x(xx) {} ~X() {} void* operat
编码的目的,就是给抽象的字符赋予一个数值,好在计算机里面表示。常见的ASCII使用8bit给字符编码,但是实际只使用了7bit,最高位没有使用,因此,只能表示128个字符;ISO-8859-1(也叫Latin-1,或者直接8859)使用全8bit编码,可以看成是ASCII的超集,因为它的低128个字
在宏定义当中,常常可以看到宏的参数以及整个宏的定义都被小括号包围,就像下面的 MIN、MAX、ABS 宏一样: 上面的图截取自 iOS 的系统库,那为什么它们需要这些括号包围起来呢? 下面假如我们自定义了宏 ceil_div,代码如下: #define ceil_div(x, y) (x + y -
c++中,当继承结构中含有虚基类时,在构造对象时编译器会通过将一个标志位置1(表示调用虚基类构造函数),或者置0(表示不调用虚基类构造函数)来防止重复构造虚基类子对象。如下图菱形结构所示:当构造类Bottom对象时,Bottom构造函数里面的c++伪码如下(单考虑标志位,不考虑其他)://Botto
在C中,使用fopen打开文件有两种模式:一种是文本模式,一种是二进制模式。那这两种模式之间有什么区别,是不是使用文本模式打开的文件就只能使用文本函数比如fprintf来操作,而使用二进制打开的文件就只能使用二进制函数比如fwrite来操作呢? 答案是否定的。C里面之所以有文本模式和二进制模式,完全
尾数英文名叫mantissa,significand,coefficient,用于科学计数法中。科学计数法的表示方法为: Mantissa x Base^Exponent 举个例子,123.45用科学计数法可以表示为: 12345 x 10^(-2) 其中12345就是尾数Mantissa,10是基
定义宏时可以让宏接收可变参数,对于可变参数的定义,标准 C 和 GNU C(GNU 对 C的扩展)是不一样的。 标准 C 标准 C 对于可变参数的定义如下,使用...: #define eprintf(...) fprintf (stderr, __VA_ARGS__) 在宏定义中,__VA_ARG
宏分为两种,一种是 object-like 宏,比如: #define STR "Hello, World!" 另一种是 function-like 宏,比如: #define MIN(X, Y) ((X) < (Y) ? (X) : (Y)) 对于 function-li
副作用(Side Effect) 在计算机当中,副作用指当调用一个函数时,这个函数除了返回一个值之外,还对主调函数产生了影响,比如修改了全局变量,修改了参数等等。 宏的重复副作用 对于求两个数中的最小数,常常可以定义一个宏 MIN,定义如下: #define MIN(X, Y) ((X) <