探索C++虚函数在g++中的实现(动多态)_虚函数表剖析

探索C++虚函数在g++中的实现

本文是我在追查一个诡异core问题的过程中收获的一点心得,把公司项目相关的背景和特定条件去掉后,仅取其中通用的C++虚函数实现部分知识记录于此。

在开始之前,原谅我先借用一张图黑一下C++:

探索C++虚函数在g++中的实现(动多态)_虚函数表剖析

“无敌”的C++

立即学习“C++免费学习笔记(深入)”;

如果你也在写C++,请一定小心…至少,你要先有所了解: 当你在写虚函数的时候,g++在写什么?

先写个例子

为了探索C++虚函数的实现,我们首先编写几个用来测试的类,代码如下:

C++

#include using namespace std;class Base1{public:    virtual void f() {        cout << "Base1::f()" << endl;    }};class Base2{public:    virtual void g() {        cout << "Base2::g()" << endl;    }};class Derived : public Base1, public Base2{public:    virtual void f() {        cout << "Derived::f()" << endl;    }    virtual void g() {        cout << "Derived::g()" << endl;    }    virtual void h() {        cout << "Derived::h()" << endl;    }};int main(int argc, char *argv[]){    Derived ins;    Base1 &b1 = ins;    Base2 &b2 = ins;    Derived &d = ins;    b1.f();    b2.g();    d.f();    d.g();    d.h();}

代码采用了多继承,是为了更多的分析出g++的实现本质,用UML简单的画一下继承关系:

探索C++虚函数在g++中的实现(动多态)_虚函数表剖析

示例代码UML图

代码的输出结果和预期的一致,C++实现了虚函数覆盖功能,代码输出如下:

Derived::f()Derived::g()Derived::f()Derived::g()Derived::h()

开始分析!

我写这篇文章的重点是尝试解释g++编译在底层是如何实现虚函数覆盖和动态绑定的,因此我假定你已经明白基本的虚函数概念以及虚函数表(vtbl)和虚函数表指针(vptr)的概念和在继承实现中所承担的作用,如果你还不清楚这些概念,建议你在继续阅读下面的分析前先补习一下相关知识,陈皓的 《C++虚函数表解析》 系列是一个不错的选择。

通过本文,我将尝试解答下面这三个问题:

g++如何实现虚函数的动态绑定?

vtbl在何时被创建?vptr又是在何时被初始化?

在Linux中运行的C++程序虚拟存储器中,vptr、vtbl存放在虚拟存储的什么位置?

首先是第一个问题:

g++如何实现虚函数的动态绑定?

这个问题乍看简单,大家都知道是通过vptr和vtbl实现的,那就让我们刨根问底的看一看,g++是如何利用vptr和vtbl实现的。

第一步,使用 -fdump-class-hierarchy 参数导出g++生成的类内存结构:

Vtable for Base1Base1::_ZTV5Base1: 3u entries0     (int (*)(...))04     (int (*)(...))(& _ZTI5Base1)8     Base1::fClass Base1   size=4 align=4   base size=4 base align=4Base1 (0xb6acb438) 0 nearly-empty    vptr=((& Base1::_ZTV5Base1) + 8u)Vtable for Base2Base2::_ZTV5Base2: 3u entries0     (int (*)(...))04     (int (*)(...))(& _ZTI5Base2)8     Base2::gClass Base2   size=4 align=4   base size=4 base align=4Base2 (0xb6acb474) 0 nearly-empty    vptr=((& Base2::_ZTV5Base2) + 8u)Vtable for DerivedDerived::_ZTV7Derived: 8u entries0     (int (*)(...))04     (int (*)(...))(& _ZTI7Derived)8     Derived::f12    Derived::g16    Derived::h20    (int (*)(...))-0x00000000424    (int (*)(...))(& _ZTI7Derived)28    Derived::_ZThn4_N7Derived1gEvClass Derived   size=8 align=4   base size=8 base align=4Derived (0xb6b12780) 0    vptr=((& Derived::_ZTV7Derived) + 8u)  Base1 (0xb6acb4b0) 0 nearly-empty      primary-for Derived (0xb6b12780)  Base2 (0xb6acb4ec) 4 nearly-empty      vptr=((& Derived::_ZTV7Derived) + 28u)

如果看不明白这些乱七八糟的输出,没关系(当然能看懂更好),把上面的输出转换成图的形式就清楚了:

探索C++虚函数在g++中的实现(动多态)_虚函数表剖析

vptr和vtbl

其中有几点尤其值得注意:

我用来测试的机器是32位机,所有vptr占4个字节,每个vtbl中的函数指针也是4个字节

每个类的主要(primal)vptr放在类内存空间的起始位置(由于我没有声明任何成员变量,可能看不清楚)

在多继承中,对应各个基类的vptr按继承顺序依次放置在类内存空间中,且子类与第一个基类共用同一个vptr

子类中声明的虚函数除了覆盖各个基类对应函数的指针外,还额外添加一份到第一个基类的vptr中(体现了共用的意义)

有了内存布局后,接下来观察g++是如何在这样的内存布局上进行动态绑定的。

g++对每个类的指针或引用对象,如果是其类声明中虚函数,使用位于其内存空间首地址上的vptr寻找找到vtbl进而得到函数地址。如果是父类声明而子类未覆盖的虚函数,使用对应父类的vptr进行寻址。

先来验证一下,使用 objdump -S 得到 b1.f() 的汇编指令:

Assembly (x86)

b1.f(); 8048734:       8b 44 24 24             mov    0x24(%esp),%eax    # 得到Base1对象的地址 8048738:       8b 00                   mov    (%eax),%eax        # 对对象首地址上的vptr进行解引用,得到vtbl地址 804873a:       8b 10                   mov    (%eax),%edx        # 解引用vtbl上第一个虚函数的地址 804873c:       8b 44 24 24             mov    0x24(%esp),%eax 8048740:       89 04 24                mov    %eax,(%esp) 8048743:       ff d2                   call   *%edx              # 调用函数

其过程和我们的分析完全一致,聪明的你可能发现了,b2怎么办呢?Derived类的实例内存首地址上的vptr并不是Base2类的啊!答案实际上是因为g++在引用赋值语句 Base2 &b2 = ins 上动了手脚:

Assembly (x86)

Derived ins; 804870d:       8d 44 24 1c             lea    0x1c(%esp),%eax 8048711:       89 04 24                mov    %eax,(%esp) 8048714:       e8 c3 01 00 00          call   80488dc     Base1 &b1 = ins; 8048719:       8d 44 24 1c             lea    0x1c(%esp),%eax 804871d:       89 44 24 24             mov    %eax,0x24(%esp)    Base2 &b2 = ins; 8048721:       8d 44 24 1c             lea    0x1c(%esp),%eax   # 获得ins实例地址 8048725:       83 c0 04                add    $0x4,%eax         # 添加一个指针的偏移量 8048728:       89 44 24 28             mov    %eax,0x28(%esp)   # 初始化引用    Derived &d = ins; 804872c:       8d 44 24 1c             lea    0x1c(%esp),%eax 8048730:       89 44 24 2c             mov    %eax,0x2c(%esp)

虽然是指向同一个实例的引用,根据引用类型的不同,g++编译器会为不同的引用赋予不同的地址。例如b2就获得一个指针的偏移量,因此才保证了vptr的正确性。

PS:我们顺便也证明了C++中的引用的真实身份就是指针…

接下来进入第二个问题:

vtbl在何时被创建?vptr又是在何时被初始化?

既然我们已经知道了g++是如何通过vptr和vtbl来实现虚函数魔法的,那么vptr和vtbl又是在什么时候被创建的呢?

vptr是一个相对容易思考的问题,因为vptr明确的属于一个实例,所以vptr的赋值理应放在类的构造函数中。 g++为每个有虚函数的类在构造函数末尾中隐式的添加了为vptr赋值的操作 。

同样通过生成的汇编代码验证:

Assembly (x86)

class Derived : public Base1, public Base2{ 80488dc:       55                      push   %ebp 80488dd:       89 e5                   mov    %esp,%ebp 80488df:       83 ec 18                sub    $0x18,%esp 80488e2:       8b 45 08                mov    0x8(%ebp),%eax 80488e5:       89 04 24                mov    %eax,(%esp) 80488e8:       e8 d3 ff ff ff          call   80488c0  80488ed:       8b 45 08                mov    0x8(%ebp),%eax 80488f0:       83 c0 04                add    $0x4,%eax 80488f3:       89 04 24                mov    %eax,(%esp) 80488f6:       e8 d3 ff ff ff          call   80488ce  80488fb:       8b 45 08                mov    0x8(%ebp),%eax 80488fe:       c7 00 48 8a 04 08       movl   $0x8048a48,(%eax) 8048904:       8b 45 08                mov    0x8(%ebp),%eax 8048907:       c7 40 04 5c 8a 04 08    movl   $0x8048a5c,0x4(%eax) 804890e:       c9                      leave 804890f:       c3                      ret

可以看到在代码中,Derived类的构造函数为实例的两个vptr赋初值,可是,这两个初值居然是立即数!立即数!立即数! 这说明了vtbl的生成并不是运行时的,而是在编译期就已经确定了存放在这两个地址上的 !

这个地址不出意料的属于.rodata(只读数据段),使用 objdump -s -j .rodata 提取出对应的内存观察:

80489e0 03000000 01000200 00000000 42617365  ............Base 80489f0 313a3a66 28290042 61736532 3a3a6728  1::f().Base2::g( 8048a00 29004465 72697665 643a3a66 28290044  ).Derived::f().D 8048a10 65726976 65643a3a 67282900 44657269  erived::g().Deri 8048a20 7665643a 3a682829 00000000 00000000  ved::h()........ 8048a30 00000000 00000000 00000000 00000000  ................ 8048a40 00000000 a08a0408 34880408 68880408  ........4...h... 8048a50 94880408 fcffffff a08a0408 60880408  ............`... 8048a60 00000000 c88a0408 08880408 00000000  ................ 8048a70 00000000 d88a0408 dc870408 37446572  ............7Der 8048a80 69766564 00000000 00000000 00000000  ived............ 8048a90 00000000 00000000 00000000 00000000  ................ 8048aa0 889f0408 7c8a0408 00000000 02000000  ....|........... 8048ab0 d88a0408 02000000 c88a0408 02040000  ................ 8048ac0 35426173 65320000 a89e0408 c08a0408  5Base2.......... 8048ad0 35426173 65310000 a89e0408 d08a0408  5Base1..........

由于程序运行的机器是小端机,经过简单的转换就可以得到第一个vptr所指向的内存中的第一条数据为0x80488834,如果把这个数据解释为函数地址到汇编文件中查找,会得到:

Assembly (x86)

08048834 :};class Derived : public Base1, public Base2{public:    virtual void f() { 8048834:       55                      push   %ebp 8048835:       89 e5                   mov    %esp,%ebp 8048837:       83 ec 18                sub    $0x18,%esp

Bingo! g++在编译期就为每个类确定了vtbl的内容,并且在构造函数中添加相应代码使vptr能够指向已经填好的vtbl的地址 。

这也同时为我们解答了第三个问题:

在Linux中运行的C++程序虚拟存储器中,vptr、vtbl存放在虚拟存储的什么位置?

直接看图:

探索C++虚函数在g++中的实现(动多态)_虚函数表剖析

虚函数在虚拟存储器中的位置

图中灰色部分应该是你已经熟悉的,彩色部分内容和相关联的箭头描述了虚函数调用的过程(图中展示的是通过new在堆区创建实例的情况,与示例代码有所区别,小失误,不要在意): 当调用虚函数时,首先通过位于栈区的实例的指针找到位于堆区中的实例地址,然后通过实例内存开头处的vptr找到位于.rodata段的vtbl,再根据偏移量找到想要调用的函数地址,最后跳转到代码段中的函数地址执行目标函数 。

总结

研究这些问题的起因是因为公司代码出现了非常奇葩的行为,经过追查定位到虚函数表出了问题,因此才有机会脚踏实地的对虚函数实现进行一番探索。

也许你会想,即使我不明白这些底层原理,也一样可以正常的使用虚函数,也一样可以写出很好的面相对象的代码啊?

这一点儿也没有错,但是,C++作为全宇宙最复杂的程序设计语言,它提供的功能异常强大,无异于武侠小说中锋利无比的屠龙宝刀。但武功不好的菜鸟如果胡乱舞弄宝刀,却很容易反被其所伤。只有了解了C++底层的原理和机制,才能让我们把C++这把屠龙宝刀使用的更加得心应手,变化出更加华丽的招式,成为真正的武林高手。

相关文章:

C#之虚函数

介绍有关C++中继承与多态的基础虚函数类

以上就是探索C++虚函数在g++中的实现(动多态)_虚函数表剖析的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1432828.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月17日 08:39:13
下一篇 2025年12月17日 08:39:25

相关推荐

  • c++中什么是多态_C++运行时多态与虚函数机制

    运行时多态通过虚函数实现,允许基类指针调用派生类函数,核心机制是vtable和vptr。满足条件:基类指针指向派生类、函数声明为virtual、派生类重写函数。示例中Animal基类的speak()被Dog和Cat重写,通过Animal*调用时执行对应派生类版本。含纯虚函数(=0)的类为抽象类,不可…

    2025年12月19日
    000
  • c++中为什么不应该在构造函数中调用虚函数_c++对象初始化阶段的虚函数陷阱

    在C++构造函数中调用虚函数无法实现多态,因为对象构造期间虚函数表尚未完全建立,此时虚函数调用会被解析为当前构造层级的版本,而非派生类重写版本,导致可能访问未初始化成员或执行错误逻辑,应避免此类行为。 在C++中,不应该在构造函数中调用虚函数,因为这会引发一个常见的陷阱:虚函数机制在对象构造过程中并…

    2025年12月19日
    000
  • c++ 虚函数和纯虚函数有什么区别_c++中虚函数机制与抽象类解析

    虚函数允许派生类重写并实现运行时多态,可提供默认实现;纯虚函数强制派生类实现特定接口,无函数体且使类成为抽象类。1. 虚函数用virtual声明,支持动态绑定,可通过基类指针调用对应派生类版本;2. 纯虚函数以=0结尾,不含实现,包含它的类不能实例化;3. 抽象类用于定义接口规范,提升代码扩展性与维…

    2025年12月19日
    000
  • C++如何实现多态和虚函数_C++继承与虚函数的多态实现方法

    多态通过虚函数实现,允许基类指针调用派生类函数。1. 基类中声明virtual函数;2. 派生类重写该函数;3. 用基类指针指向派生类对象并调用虚函数,实现运行时动态绑定。示例中Animal类的speak()为虚函数,Dog和Cat类重写speak(),通过Animal指针调用时输出各自声音。若未使…

    2025年12月19日
    000
  • c++什么是虚函数 (virtual function)_c++多态与虚函数原理说明

    虚函数通过virtual关键字实现多态,允许派生类重写函数,调用时根据对象实际类型确定执行版本。1. 基类声明virtual函数,派生类可override;2. 通过基类指针或引用调用时,程序依据对象类型而非指针类型选择函数;3. C++底层通过vtable和vptr实现动态绑定,每个含虚函数的类有…

    2025年12月19日
    000
  • c++中虚函数(virtual function)是如何工作的_虚函数表与多态实现原理解析

    虚函数通过vtable和vptr实现运行时多态:1. 含虚函数的类生成vtable存储函数地址,对象内含vptr指向该表;2. 派生类覆盖虚函数时更新vtable对应条目;3. 调用时通过vptr找到实际vtable,查表调用对应函数,实现动态分发;4. 存在轻微性能开销,构造函数和静态函数不能为虚…

    2025年12月19日
    000
  • c++中的虚函数virtual是什么_c++虚函数机制与作用详解

    虚函数实现运行时多态,通过virtual关键字声明,派生类重写后可通过基类指针调用实际类型的函数;底层由vtable和vptr机制支持,实现动态绑定;纯虚函数定义为virtual func()=0,含纯虚函数的类为抽象类,不能实例化;基类析构函数需声明为虚函数,防止派生类对象析构时资源泄漏。 在C+…

    2025年12月19日
    000
  • c++中为什么基类的析构函数应该是虚函数_c++基类析构函数为何需设为虚函数

    基类析构函数应声明为虚函数,以确保通过基类指针删除派生类对象时能正确调用派生类析构函数,防止资源泄漏。 在C++中,基类的析构函数应该声明为虚函数,主要是为了确保通过基类指针删除派生类对象时,能够正确调用派生类的析构函数,避免资源泄漏和未定义行为。 对象销毁时的析构顺序问题 当一个派生类对象通过基类…

    2025年12月19日
    000
  • c++怎么理解虚函数和纯虚函数_c++虚函数与纯虚函数原理解析

    虚函数通过vtable和vptr实现动态绑定,允许派生类重写并确保运行时调用正确版本;纯虚函数=0定义接口,使类成为抽象类,强制派生类实现,用于构建清晰的多态体系。 虚函数和纯虚函数是C++实现多态的核心机制,理解它们的原理对掌握面向对象编程至关重要。关键在于动态绑定——程序在运行时根据对象的实际类…

    2025年12月19日
    000
  • c++中什么是多态以及如何实现_c++多态概念与实现方法总结

    多态是C++中通过继承和虚函数实现“同一接口,多种实现”的机制,允许基类指针调用派生类的重写函数,实现运行时动态绑定,提升代码灵活性与可扩展性。 多态是面向对象编程的核心特性之一,在C++中它允许不同类的对象对同一消息作出不同的响应。简单来说,就是“同一个接口,多种实现”。多态提高了代码的灵活性和可…

    2025年12月19日
    000
  • c++怎么实现继承和多态_c++继承与多态实现示例

    继承使子类复用父类成员,多态通过虚函数实现运行时动态绑定;示例中Animal为基类,Dog和Cat继承并重写makeSound,通过基类指针调用实现不同行为。 在C++中,继承和多态是面向对象编程的两个核心特性。通过继承,子类可以复用父类的成员变量和方法;通过多态,可以在运行时根据对象的实际类型调用…

    2025年12月19日
    000
  • c++中什么是虚函数_c++虚函数原理与用法详解

    虚函数实现C++运行时多态,通过基类指针调用派生类函数。1. 使用virtual声明虚函数,派生类用override重写;2. 底层通过vtable和vptr实现动态绑定,每个对象含vptr指向vtable,查找函数地址;3. 纯虚函数virtual func() = 0;使类成为抽象类,不可实例化…

    2025年12月19日
    000
  • C++如何使用虚函数实现接口抽象

    C++通过纯虚函数实现接口抽象,定义含纯虚函数的基类(如Animal)形成接口,派生类(如Dog、Cat)必须实现其方法,结合虚析构函数确保资源正确释放,利用基类指针实现多态调用,提升代码解耦与可维护性。 使用虚函数,C++就能实现接口抽象。关键在于定义一个包含纯虚函数的基类,这个基类就成了接口,任…

    2025年12月18日
    000
  • C++的虚函数表(vtable)是如何影响对象内存布局的

    C++虚函数表通过在对象中添加vptr指针影响内存布局,增加对象大小并调整成员变量偏移,vptr指向存储虚函数地址的vtable,实现多态调用;派生类覆盖或新增虚函数时更新对应vtable条目,多重继承可能引入多个vptr;静态成员变量存于静态区,不参与对象布局。 C++的虚函数表(vtable)通…

    2025年12月18日
    000
  • C++模板类继承与虚函数结合使用

    模板类与虚函数结合可实现泛型多态,通过模板定义抽象基类,派生类重写虚函数,利用指针或引用实现运行时多态,适用于策略模式等场景。 在C++中,模板类与虚函数的结合使用是一个高级话题,涉及泛型编程和运行时多态的交互。虽然模板是编译时机制,而虚函数依赖运行时动态绑定,但两者可以协同工作,尤其在设计灵活且可…

    2025年12月18日
    000
  • C++如何减少虚函数调用开销

    减少虚函数开销的关键是降低动态绑定需求,主要策略包括:使用模板实现静态多态以消除运行时开销,但无法完全替代虚函数,因模板不适用于运行时类型未知的场景;可结合CRTP模式提升性能,但增加复杂性;启用链接时优化(LTO)使编译器跨单元分析并可能将虚调用转为直接调用,效果依赖代码结构和编译器能力;还可手动…

    2025年12月18日
    000
  • C++如何实现多级继承和多态结合

    多级继承与多态通过虚函数和继承链实现灵活的类层次结构,支持代码复用、接口统一和扩展性,需注意虚析构函数、vtable机制及菱形继承问题,合理设计避免过度继承。 多级继承和多态结合,本质上是为了构建更复杂、更灵活的类层次结构。通过继承,子类可以复用父类的代码,而多态则允许我们以统一的方式处理不同类型的…

    2025年12月18日
    000
  • C++模板类与多态结合实现通用接口

    答案:C++模板类与多态结合通过抽象基类定义统一接口,模板派生类封装具体类型操作,实现异构对象的统一管理与高效处理,兼顾编译期优化与运行时灵活性,适用于命令模式、事件系统等需类型安全与多态共存的场景。 在C++的世界里,模板类与多态的结合,在我看来,是一种相当精妙的设计哲学,它允许我们构建出既能享受…

    2025年12月18日
    000
  • C++如何实现多态与动态绑定

    多态通过虚函数和基类指针实现,运行时根据对象实际类型调用对应函数。1. 基类中声明virtual函数,派生类重写;2. 通过基类指针或引用调用时触发动态绑定;3. 纯虚函数=0定义抽象类,强制派生类实现;4. 虚析构函数确保delete时正确调用派生类析构;5. 底层由vtable机制支持,对象含v…

    2025年12月18日
    000
  • C++如何实现策略模式和多态结合

    策略模式通过抽象基类定义统一接口,具体策略类重写虚函数实现多态;2. 上下文使用基类指针调用execute,动态切换不同策略算法。 在C++中,策略模式结合多态主要通过基类指针或引用调用派生类的虚函数来实现行为的动态切换。核心是定义一个抽象策略接口,多个具体策略实现该接口,上下文类通过多态调用不同策…

    2025年12月18日
    000

发表回复

登录后才能评论
关注微信