尽量少做转型动作——条款27

最新推荐文章于 2021-04-06 22:05:53 发布

原创最新推荐文章于 2021-04-06 22:05:53 发布 · 287 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#转型操作 #C++转型 #static_cast #const_cast #dynamic_cast

Effective C++ 专栏收录该内容

53 篇文章

订阅专栏

本文深入探讨C++中的转型概念，包括旧式转型和新式转型（const_cast、dynamic_cast、reinterpret_cast、static_cast）的区别与用途，以及它们对类型系统的影响。文章强调减少转型使用的重要性，并提出设计替代方案以避免效率较低的dynamic_cast。

C++规则的设计目标之一是，保证“类型错误”绝不可能发生。理论上如果你的程序很“干净地”通过编译，就表示它并不企图在任何对象身上执行任何不安全、无意义、愚蠢荒谬的操作。这是一个极具价值的保证，可别草率地放弃它。

不幸的是，转型（casts）破坏了类型系统（type system）。那可能导致任何种类的麻烦，有些容易辨识，有些非常隐晦。让我们首先回顾转型语法，因为通常有三种不同的形式，可写出相同的转型动作，C风格的转型动作看起来像这样：

（T）expression // 将expression转型为T

函数风格的转型动作看起来像这样：

T（expression） // 将expression转型为T

两种形式并无差别，纯粹只是小括号的摆放位置不同而已。我称此二种形式为“旧式转型”（old-style casts）。

C++还提供四种新式转型（尝尝被称为new-style或C++-style casts）：

const_cast<T>(expression)
dynamic_cast<T>(expression)
reinterpret_cast<T>(expression)
static_cast<T>(expression)

各有不同的目的：

const_cast：通常被用来将对象的常量性转除（cast away the constness）。它也是唯一有此能力的C++ style转型操作符。
dynamic_cast：主要用来执行“安全向下转型”（safe downcasting），也就是用来决定某对象是否归属继承体系中的某个类型。它是唯一无法由旧式语法执行的动作，也是唯一可能耗费重大运行成本的转型动作（稍后细谈）。
reinterpret_cast：意图执行低级转型，实际动作（及结果）可能取决于编译器，这也就表示它不可移植。例如将一个pointer to int转型为一个int。这一类型在低级代码以外很少见。
static_cast：用来强迫隐式转换（implicit conversions），例如将non-const对象转为const对象（就像条款3所为），或将int转为double等等。它也可以用来执行上述多种转换的反向转换，例如将void*指针转为typed指针，将pointer-to-base转为pointer-to-derived。但它无法将const转为non-const——这个只有const_cast才办得到。

旧式转型仍然合法，但新式转型较受欢迎。原因是：

第一，它们很容易在代码中被辨识出来（不论是人工辨识或使用工具如grep），因而得以简化“找出类型系统在哪个地点被破坏”的过程。

第二，各转型动作的目标愈窄化，编译器愈可能诊断出错误的运用。举个例子，如果你打算将常量性（constness）去掉，除非使用新式转型中的const_cast否则无法通过编译。

我唯一使用旧式转型的时机是，当我要调用一个explicit构造函数将一个对象传递给一个函数时。例如：

class Widget {
public:
	explicit Widget(int size);
	...
};
void doSomeWork(const Widget& w);
doSomeWork(Widget(15));        // 以一个int加上“函数风格”的转型动作创建一个Widget。
doSomeWork(static_cast<Widget>(15));    // 以一个int加上"C++ 风格"的转型动作创建一个Widget。

从某个角度来说，蓄意的“对象生成”动作感觉不怎么像转型“转型”，所以我很可能使用函数风格的转型动作而不使用static_cast。撰写之时我们往往“觉得”通情达理，所以或许最好是忽略你的感觉，始终理智地使用新式转型。

许多程序员相信，转型其实什么都没做，只是告诉编译器把某种类型视为另一种类型。任何一个类型转换（不论是通过转型操作而进行的显示转换，或通过编译器完成的隐式转换）往往真的令编译器编译出运行期间的执行代码。

例如这段程序：

int x, y;
...
double d = static_cast<double>(x)/y;  // x除以y，使用浮点数除法

将int x转型为double几乎肯定会产生一些代码，因为在大部分计算器体系结构中，int的底层表示不同于double的底层表述。

这或许不会让你惊讶，但下面这个例子就可能让你稍微睁大眼睛了：

class Base {...};
class Derived:public Base{...};
Derived d;
Base* pb = &d;    //  隐喻地将Derived*转换为Base*

这里我们不过是建立一个base class指针指向一个derived class对象，但有时候上述的两个指针值并不相同。这种情况下会有个偏移量（offset）在运行期被施行于Derived*指针身上，用以取得正确的Base*指针值。

上述例子表明，单一对象（例如一个类型为Derived的对象）可能拥有一个以上的地址（例如“以Base*指向它”时的地址和“以Derived*指向它”时的地址。）行为。

但请注意，我说的是有时候需要一个偏移量。对象的布局方式和它们的地址计算方式随编译器的不同而不同，那意味“由于知道对象如何布局”而设计的转型，在某一平台行得通，在其它平台并不一定行得通。这个世界有许多悲惨的程序员，他们历经千辛万苦才学到这堂课。

在探究dynamic_cast设计意涵之前，值得注意的是，dynamic_cast的许多实现版本执行速度相当慢。例如至少有一个很普遍的实现版本基于“class名称之字符串比较”，如果你在四层深的单继承体系内的某个对象身上执行dynamic_cast，刚才说的那个实现版本所提供的每一次dynamic_cast可能会好用多达四次的strcmp调用，用以比较class名称。深度继承或多重继承的成本更高！

之所以需要dynamic_cast,通常是因为你想在一个你认定为Derived class对象身上执行Derived class操作函数，但你的手上却只有一个“指向base”的pointer或reference，你只能靠它们来处理对象。有两个一般性做法可以避免这个问题。

第一，使用容器并在其中存储直接执行Derived class对象的指针（通常是智能指针，见条款13），如此便消除了“通过base class接口处理对象”的需要。例如：

class Window {...};
class SpecialWindow: public Window {
public:
	void blink();
	...
};
typedef std::vector<std::tr1::shared_ptr<Window>> VPM; // 关于tr1::shared_ptr 见条款13
VPM winPtrs;
...
for (VPW::iterator iter = winPtrs.begin(); iter != winPtrs.end(); ++iter) {
	if (SpecialWindow *psw = dynamic_cast<SpecialWindow*>(iter->get()))    // 不希望使用dynamic_cast
		psw->blink();
}
        
应该改成这样：
typedef std::vector<std::tr1::shared_ptr<Window>> VPM; // 关于tr1::shared_ptr 见条款13
VPM winPtrs;
...
for (VPW::iterator iter = winPtrs.begin(); iter != winPtrs.end(); ++iter) {
	// 这样写比较好，不使用dynamic_cast
	(*iter)->blink();
}

这种做法使你无法在同一个容器内存储指针“指向所有可能之各种Window派生类”。如果真要处理多种窗口类型，你可能需要多个容器，它们都必须具备类型安全性（type-safe）。

另一种做法可让你通过base class接口处理“所有可能之各种Window派生类”，那就是在base class内提供virtual函数做你想对各个Window派生类做的事。例如，上述例子中虽然只有SpecialWindows可以闪烁，但或许闪烁函数声明base class内并提供一份“什么也没做”的缺省实现码是有意义的：

class Window {
public:
	virtual void blink() {}  // 缺省实现代码”什么也没做“;
	...                      // 条款34告诉你为什么缺省实现代码可能是个馊主意。
};
class SpecialWindow: public Window {
public:
	virtual void blink();    // 在此class内，blink做某些事。
	...
};
typedef std::vector<std::tr1::shared_ptr<Window>> VPM; 
VPM winPtrs;                                           // 容器，内含指针，指向所有可能的Window类型。      
...
for (VPW::iterator iter = winPtrs.begin(); iter != winPtrs.end(); ++iter) {
	// 注意，这里没有dynamic_cast
	(*iter)->blink();
}

无论哪一种写法——“使用类型安全容器”或“将virtual函数往继承体系上方移动”——都并非放之四海皆准，但在许多情况下它们都提供一个可行的dynamic_cast替代方案。当它们由此功效时，你应该欣然拥抱它们。

绝对必须避免一件事是所谓的“连串（cascading）dynamic_casts”，也就是看起来像这样的东西：

class Window {...};
...                  // derived classes定义在这里
typedef std::vector<std::tr1::shared_ptr<Window>> VPM; 
VPM winPtrs;                                           // 容器，内含指针，指向所有可能的Window类型。      
...
for (VPW::iterator iter = winPtrs.begin(); iter != winPtrs.end(); ++iter) {
	if (SpecialWindow1 *psw1 = dynamic_cast<SpecialWindow1>(iter->get())){...}
	else if (SpecialWindow2 *psw2 = dynamic_cast<SpecialWindow2>(iter->get())){...}
	else if (SpecialWindow3 *psw3 = dynamic_cast<SpecialWindow3>(iter->get())){...}
	...
}

这样的代码又大又慢，而且基础不稳，因为每次Window class继承体系一有改变，所有这一类代码都必须再次检阅是否需要修改。一旦假如新的Derived class，或许上述判定中要加入新的条件分支。这样的带应该总是以某些“基于virtual函数调用”的东西取而代之。

优良的C++带很少使用转型，但若说要完全摆脱它们又太过不切实际。我们应该尽可能隔离转型动作，通常把它隐藏在某个函数内，函数的接口会保护调用者不受函数内部任何动作影响。

请记住