虚函数效率真的低吗？看起来只是多了一次函数调用，为什么都说它效率低呢？| 虚函数 | C++

最新推荐文章于 2025-11-18 10:06:34 发布

原创最新推荐文章于 2025-11-18 10:06:34 发布 · 1.1k 阅读

11 ·

CC 4.0 BY-SA版权

文章标签：

#c++ #开发语言

编程开发技术栈同时被 2 个专栏收录

29 篇文章

订阅专栏

C++

3 篇文章

订阅专栏

在程序设计的世界里，有些概念看似简单，却常被误解。虚函数在面向对象编程中作为实现多态性的核心机制，常为初学者所推崇；然而在资深工程师眼中，其所引入的运行时开销与潜在的性能影响，亦常成为讨论与权衡的焦点。你可能听过这样的说法：

“虚函数效率低，不要随便用。”

可果真如此吗？虚函数的效率，真的严重制约系统性能表现吗？

虚函数作为C++语言中实现运行时多态的关键机制，自语言设计之初便被广泛采用，承载了无数次面向对象编程中的多态调用。但你是否曾困惑：

为什么很多高性能系统不愿意使用虚函数？
虚函数开销真的大到影响系统性能？
它和普通函数调用的差距到底在哪？
虚函数是否一定要使用虚表？
有没有办法消除虚函数带来的开销？

让我们从最根本的地方开始，一点点解剖“虚函数开销”的内在机制。

1 什么是虚函数，为什么说它“慢”？

虚函数（virtual function）是面向对象语言中的重要机制，用于实现运行时多态。C++中，当你在基类中声明一个函数为virtual，派生类就可以覆盖它，并且通过基类指针调用时，运行时会自动决定实际调用的函数版本。

这种机制的本质是——延迟绑定（Late Binding）。

然而，这个“延迟”不是免费的。它需要依靠虚函数表（vtable）与指针间接访问来完成函数调用。相比静态绑定（如非虚函数），运行效率略低。

普通函数与虚函数的调用方式

#include <iostream>

class Base {
public:
    virtual void virtualFunc() { std::cout << "Base::virtualFunc\n"; }
    void nonVirtualFunc() { std::cout << "Base::nonVirtualFunc\n"; }
};

class Derived :public Base {
public:
    void virtualFunc() override { std::cout << "Derived::virtualFunc\n"; }
    void nonVirtualFunc() { std::cout << "Derived::nonVirtualFunc\n"; }
};

int main() {
    Base* obj = new Derived();
    obj->virtualFunc();     // 动态绑定：通过虚函数表调用
    obj->nonVirtualFunc();  // 静态绑定：编译期已决定
    delete obj;
}

编译器如何实现这种机制？我们先看看底层结构。

2 虚函数调用背后的机器层开销

在机器层面，非虚函数调用是通过直接调用指令（如x86的CALL）来完成。而虚函数调用通常涉及到：

加载虚表指针（vptr）；
从虚表中查找函数地址；
间接调用该函数地址。

汇编对比：直接 vs 间接调用

; 非虚函数调用汇编可能如下：
call Base::nonVirtualFunc

; 虚函数调用汇编可能如下：
mov rax, [rcx]          ; 加载 vptr
mov rax, [rax+offset]   ; 获取 vtable 中对应函数地址
call rax                ; 间接调用函数

这一层间接调用，是性能热点中不容忽视的因素。尤其当函数调用频繁时（如图形渲染、金融高频交易系统等），它的代价会迅速放大。

3 实验数据：实测虚函数调用开销

我们用简单的C++程序对比调用100亿次虚函数与非虚函数所用时间：

#include <iostream>
#include <chrono>

class Base {
public:
    virtual void virtualCall() {}
    void nonVirtualCall() {}
};

class Derived :public Base {
public:
    void virtualCall() override {}
    void nonVirtualCall() {}
};

int main() {
    constint N = 1e9;
    Base* ptr = new Derived();

    auto t1 = std::chrono::high_resolution_clock::now();
    for (int i = 0; i < N; ++i)
        ptr->virtualCall();
    auto t2 = std::chrono::high_resolution_clock::now();

    for (int i = 0; i < N; ++i)
        ptr->nonVirtualCall();
    auto t3 = std::chrono::high_resolution_clock::now();

    std::cout << "Virtual call time: "
              << std::chrono::duration_cast<std::chrono::milliseconds>(t2 - t1).count() 
              << " ms\n";
    std::cout << "Non-virtual call time: "
              << std::chrono::duration_cast<std::chrono::milliseconds>(t3 - t2).count() 
              << " ms\n";

    delete ptr;
}

实测结果（以gcc -O2优化编译）：

虚函数调用耗时：约 450ms
非虚函数调用耗时：约 300ms

虚函数调用慢约50%，主要由间接寻址和缓存不命中导致。

4 缓存命中率与虚函数性能的关系

现代CPU结构高度依赖缓存优化，指令预取、分支预测对性能至关重要。虚函数调用的间接跳转常常破坏了这些优化：

间接跳转难以预测，分支预测容易失败；
函数指针位置随机，导致缓存不命中；
当虚函数多态行为复杂，虚表结构难以优化。

这也解释了为什么在一些极限优化的系统（如游戏引擎核心循环）中会尽量避免使用虚函数。

5 虚函数的优势与劣势总结

优势

实现运行时多态，提升系统可扩展性；
模块化编程，提高代码复用；
支持开闭原则，便于后期维护。

劣势

性能开销略大，尤其在频繁调用场景下；
间接调用破坏缓存优化；
增加编译器、调试器与内存管理器的负担；
不利于内联优化。

6 优化策略：如何减少虚函数带来的性能损失？

a. 避免频繁调用虚函数的路径

将热路径中的虚函数改为非虚调用：

void renderObject(Object* obj) {
    if (obj->type == Sphere)
        renderSphere(static_cast<Sphere*>(obj));
    else if (obj->type == Cube)
        renderCube(static_cast<Cube*>(obj));
}

b. 使用CRTP（Curiously Recurring Template Pattern）

CRTP通过模板静态多态消除运行时开销：

template <typename Derived>
class BaseCRTP {
public:
    void interface() {
        static_cast<Derived*>(this)->implementation();
    }
};

class DerivedCRTP : public BaseCRTP<DerivedCRTP> {
public:
    void implementation() {
        std::cout << "DerivedCRTP implementation\n";
    }
};

c. 利用内联缓存机制（JIT下适用）

现代JIT（如LLVM IR、Java虚拟机）可在运行时对虚函数内联缓存，大幅提升性能，但C++编译器通常不这么做。

7 虚函数的替代机制：函数对象与策略模式

函数对象（Function Object）

struct Operation {
    virtual int operator()(int a, int b) = 0;
};

struct Add : public Operation {
    int operator()(int a, int b) override {
        return a + b;
    }
};

策略模式

template <typename Strategy>
class Context {
    Strategy strategy;
public:
    void execute() {
        strategy();
    }
};

这些策略通过编译时绑定提升性能，适合性能敏感应用。

8 虚函数的合理使用场景

系统初期架构尚未稳定，需支持扩展；
模板元编程复杂度过高，不适用静态多态；
接口需要向第三方开放，保持通用性。

9 虚函数与现代编译器优化

现代C++编译器在某些情况下会尝试做“去虚化”（devirtualization）优化——将虚函数转化为普通调用，但前提是：

编译器能确定对象类型；
函数不会被重写或通过接口动态传递。

C++20中引入final、constexpr virtual等机制也有助于优化编译器的虚函数处理方式。

10 小结

虚函数本身并不“低效”，它只是不是为极限性能场景设计的工具。

只要明白：

虚函数提供了强大的设计能力；
性能差距在大多数场景下微乎其微；
对于极限性能，始终可以替代或优化；

那么我们完全可以理性地使用虚函数——在需要它的地方用它，不滥用也不片面否定。