[翻译] Effective C++, 3rd Edition, Item 11: 在 operator= 中处理 assignment to self(自赋值)

Item 11: 在 operator= 中处理 assignment to self(自赋值)

作者:Scott Meyers

译者:fatalerror99 (iTePub's Nirvana)

发布:http://blog.youkuaiyun.com/fatalerror99/

当一个 object(对象)赋值给自己的时候就发生了一次 assignment to self(自赋值):

class Widget { ... };

Widget w;
...

w = w;                                   // assignment to self

这看起来很愚蠢,但它是合法的,所以应该确信客户会这样做。另外,assignment(赋值)也并不总是那么容易辨别。例如,

a[i] = a[j];                             // potential assignment to self

如果 ij 有同样的值就是一个 assignment to self(自赋值),还有

*px = *py;                               // potential assignment to self

如果 pxpy 碰巧指向同一个东西,这也是一个 assignment to self(自赋值)。这些不太明显的 assignments to self(自赋值)是由 aliasing(别名)(有不止一个方法引用一个 object(对象))造成的。通常,使用 references(引用)或者 pointers(指针)操作相同类型的多个 objects(对象)的代码需要考虑那些 objects(对象)可能相同的情况。实际上,如果两个 objects(对象)来自同一个 hierarchy(继承体系),甚至不需要声明为相同的类型,因为一个 base class(基类)的 reference(引用)或者 pointer(指针)也能够引向或者指向一个 derived class(派生类)类型的 object(对象):

class Base { ... };

class Derived: public Base { ... };

void doSomething(const Base& rb,                   // rb and *pd might actually be
                 Derived* pd);                     // the same object

如果你遵循 Items 1314 的建议,你应该总是使用 objects(对象)来管理 resources(资源),而且你应该确保那些 resource-managing objects(资源管理对象)被拷贝时行为良好。在这种情况下,你的 assignment operators(赋值运算符)在你没有考虑自赋值的时候可能也是 self-assignment-safe(自赋值安全)的。然而,如果你试图自己管理 resources(资源)(如果你正在写一个 resource-managing class(资源管理类),你当然必须这样做),你可能会落入在你用完一个 resource(资源)之前就已意外地将它释放的陷阱。例如,假设你创建了一个 class(类),它持有一个指向动态分配 bitmap(位图)的 raw pointer(裸指针):

class Bitmap { ... };

class Widget {
  ...

private:
  Bitmap *pb;                                     // ptr to a heap-allocated object
};

下面是一个表面上看似合理 operator= 的实现,但如果出现 assignment to self(自赋值)则是不安全的。(它也不是 exception-safe(异常安全)的,但我们要过一会儿才会涉及到它。)

Widget&
Widget::operator=(const Widget& rhs)              // unsafe impl. of operator=
{
  delete pb;                                      // stop using current bitmap
  pb = new Bitmap(*rhs.pb);                       // start using a copy of rhs's bitmap

  return *this;                                   // see Item 10
}

这里的 self-assignment(自赋值)问题在 operator= 的内部,*this(赋值的目标)和 rhs 可能是同一个 object(对象)。如果它们是,则那个 delete 不仅会销毁 current object(当前对象)的 bitmap(位图),也会销毁 rhs 的 bitmap(位图)。在函数的结尾,Widget ——通过 assignment to self(自赋值)应该没有变化——发现自己持有一个指向已删除 object(对象)的指针!

防止这个错误的传统方法是在 operator= 的开始处通过 identity test(一致性检测)来阻止 assignment to self(自赋值):

Widget& Widget::operator=(const Widget& rhs)
{
  if (this == &rhs) return *this;   // identity test: if a self-assignment,
                                    // do nothing
  delete pb;
  pb = new Bitmap(*rhs.pb);

  return *this;
}

这个也能工作,但是我在前面提及那个 operator= 的早先版本不仅仅是 self-assignment-unsafe(自赋值不安全)的,它也是 exception-unsafe(异常不安全)的,而且这个版本还有异常上的麻烦。详细地说,如果 "new Bitmap" 表达式引发一个 exception(异常)(可能因为供分配的内存不足或者因为 Bitmap 的 copy constructor(拷贝构造函数)抛出一个异常),Widget 将以持有一个指向被删除的 Bitmap 的指针而告终。这样的指针是有毒的,你不能安全地删除它们。你甚至不能安全地读取它们。你对它们唯一能做的安全的事情大概就是花费大量的调试精力来断定它们起因于哪里。

幸亏,使 operator= exception-safe(异常安全)一般也同时弥补了它的 self-assignment-safe(自赋值安全)。这就导致了更加通用的处理 self-assignment(自赋值)问题的方法就是忽略它,而将焦点集中于达到 exception safety(异常安全)。Item 29 更加深入地探讨了 exception safety(异常安全),但是在本 Item 中,已经足以看出,在很多情况下,仔细地调整一下语句的顺序就可以得到 exception-safe(异常安全)(同时也是 self-assignment-safe(自赋值安全))的代码。例如,在这里,我们只要注意不要删除 pb,直到我们拷贝了它所指向的目标之后:

Widget& Widget::operator=(const Widget& rhs)
{
  Bitmap *pOrig = pb;               // remember original pb
  pb = new Bitmap(*rhs.pb);         // make pb point to a copy of *pb
  delete pOrig;                     // delete the original pb

  return *this;
}

现在,如果 "new Bitmap" 抛出一个 exception(异常),pb(以及它所在的 Widget)的遗迹没有被改变。甚至不需要 identity test(一致性检测),这里的代码也能处理 assignment to self(自赋值),因为我们做了一个原始 bitmap(位图)的拷贝,删除原始 bitmap(位图),然后指向我们作成的拷贝。这可能不是处理 self-assignment(自赋值)的最有效率的做法,但它能够工作。

如果你关心效率,你可以在函数开始处恢复 identity test(一致性检测)。然而,在这样做之前,先问一下自己,你认为 self-assignments(自赋值)发生的频率是多少,因为这个检测不是免费午餐。它将使代码(源代码和目标代码)有少量增大,而且它将在控制流中引入一个分支,这两点都会降低运行速度。例如,instruction prefetching(指令预读),caching(缓存)和 pipelining(流水线操作)的效力都将被降低。

另一个可选的手动排列 operator= 中语句顺序以确保实现是 exception- and self-assignment-safe(异常和自赋值安全)的方法是使用被称为 "copy and swap" 的技术。这一技术和 exception safety(异常安全)关系密切,所以将在 Item 29 中描述。然而,这是一个写 operator= 的足够通用的方法,值得一看,这样一个实现看起来通常就像下面这样:

class Widget {
  ...
  void swap(Widget& rhs);       // exchange *this's and rhs's data;
  ...                           // see Item 29 for details
};

Widget& Widget::operator=(const Widget& rhs)
{
  Widget temp(rhs);             // make a copy of rhs's data

  swap(temp);                   // swap *this's data with the copy's
  return *this;
}

在这个主题上的一个变种利用了如下事实:(1)一个 clsaa(类)的 copy assignment(拷贝赋值运算符)可以被声明为 take its argument by value(以传值方式取得它的参数);(2)通过传值方式传递某些东西以做出它的一个 copy(拷贝)(参见 Item 20):

Widget& Widget::operator=(Widget rhs)   // rhs is a copy of the object
{                                       // passed in — note pass by val

  swap(rhs);                            // swap *this's data with
                                        // the copy's
  return *this;
}

对我个人来说,我担心这个方法在灵活的祭坛上牺牲了清晰度,但是通过将拷贝操作从函数体中转移到参数的构造中,有时能使编译器产生更有效率的代码倒也是事实。

Things to Remember

  • 当一个 object(对象)被赋值给自己的时候,确保 operator= 是行为良好的。技巧包括比较 source(源)和 target objects(目标对象)的地址,关注语句顺序,和 copy-and-swap
  • 如果两个或更多 objects(对象)相同,确保任何操作多于一个 object(对象)的函数行为正确。
<think>好的,我现在需要处理用户的问题:Clang-Tidy提示“Operator=() does not handle self-assignment properly&rdquo;。用户之前已经询问过如何实现移动构造和移动赋值,现在遇到了自赋值的问题。我需要先理解这个警告的含义,然后分析用户提供的代码可能哪里出了问题,最后给出解决方案。 首先,用户提供的代码中,移动赋值运算符和拷贝赋值运算符都有自赋值的检查,比如在移动赋值运算符中有if (this != &other)。但Clang-Tidy仍然提示自赋值处理不当,这可能是因为代码中虽然检查了自赋值,但在处理资源时可能存在潜在的问题。例如,在拷贝赋值运算符中,先删除当前的str_,然后分配新的内存,并复制内容。如果在自赋值的情况下,没有进行检查,删除str_后,other.str_其实已经被释放了,这时候再访问就会有问题。 需要检查用户提供的拷贝赋值运算符是否正确处理自赋值。比如,用户之前的拷贝赋值运算符是这样的: String& operator=(const String& other) { if (this != &other) { delete[] str_; len_ = other.len_; str_ = new char[len_ + 1]; strcpy(str_, other.str_); } return *this; } 这里确实有自赋值检查,所以看起来没问题。但Clang-Tidy仍然报错,可能是什么原因呢?或者用户可能在实际代码中遗漏了自赋值检查? 或者,Clang-Tidy可能检测到在某些情况下,即使有自赋值检查,仍然存在潜在风险。比如,在拷贝赋值运算符中,先删除str_,然后从other中复制数据。如果other和this是同一个对象,删除str_后,other.str_已经无效,这时候new和strcpy操作就会访问已释放的内存,导致未定义行为。 所以正确的做法应该是在拷贝赋值运算符中,先创建新的内存,复制数据,然后再释放旧的内存。这样可以避免自赋值时的悬空指针问题。例如: String& operator=(const String& other) { if (this != &other) { char* new_str = new char[other.len_ + 1]; strcpy(new_str, other.str_); delete[] str_; str_ = new_str; len_ = other.len_; } return *this; } 这样,即使other和this是同一个对象,因为先创建了新的内存,复制了内容,再删除旧的内存,就不会出现访问已释放内存的问题。原来的代码中,先删除str_,然后复制,这时候如果自赋值,other.str_已经被删除,所以strcpy会出错。 因此,用户的问题可能出在拷贝赋值运算符的实现顺序上,没有遵循“先分配新资源,再释放旧资源&rdquo;的最佳实践。Clang-Tidy检测到了这一点,提示自赋值处理不当。 接下来,我需要整理这个思路,解释问题所在,并提供正确的代码示例,同时说明为什么原来的实现有问题,以及如何修复。另外,还需要提醒用户关于移动赋值运算符中的自赋值检查是否必要,因为移动赋值通常处理右值,自赋值可能性较低,但为了安全起见仍然保留检查。 最后,总结注意事项,帮助用户避免类似问题,确保代码的健壮性。</think>--- ### 一、问题本质分析 当 Clang-Tidy 提示 `Operator=() does not handle self-assignment properly` 时,核心问题在于**拷贝/移动赋值运算符未正确处理 `x = x` 这种自赋值场景**。未正确处理自赋值可能导致以下问题: | 错误类型 | 直接后果 | 典型场景 | |------------------|----------------------------------|----------------------| | 内存双重释放 | 程序崩溃或未定义行为 | 自赋值时释放原内存 | | 悬空指针访问 | 数据损坏或段错误 | 自赋值后访问已释放内存 | | 资源泄漏 | 内存逐渐耗尽 | 未正确接管新资源 | --- ### 二、问题复现示例 #### 错误实现代码 ```cpp // 有缺陷的拷贝赋值运算符实现 String& operator=(const String& other) { delete[] str_; // 危险操作:若自赋值会立即销毁自身资源 len_ = other.len_; str_ = new char[len_ + 1]; strcpy(str_, other.str_); // 若自赋值,此时复制的是已释放的内存! return *this; } ``` #### 自赋值场景演示 ```cpp String s("Hello"); s = s; // 触发自赋值 // 此时 s.str_ 指向已释放的内存区域 ``` --- ### 三、标准解决方案 #### 1. 拷贝赋值运算符修复方案 ```cpp String& operator=(const String& other) { if (this != &other) { // 关键点1:自赋值检查 char* new_str = new char[other.len_ + 1]; // 关键点2:先创建新资源 strcpy(new_str, other.str_); delete[] str_; // 关键点3:后释放旧资源(安全顺序) str_ = new_str; len_ = other.len_; } return *this; } ``` #### 修复原理说明 - **执行顺序保障**:先创建新资源,再释放旧资源,避免自赋值时资源丢失 - **自赋值检查**:`if (this != &other)` 跳过无意义的操作 - **异常安全**:若 `new` 失败,原对象仍保持有效状态 #### 2. 移动赋值运算符注意事项 ```cpp String& operator=(String&& other) noexcept { if (this != &other) { // 虽然自移动极少发生,但仍需保护 delete[] str_; str_ = other.str_; // 接管资源 len_ = other.len_; other.str_ = nullptr; // 置空源对象 other.len_ = 0; } return *this; } ``` --- ### 四、自赋值处理技术对比 | 方法 | 优点 | 缺点 | 适用场景 | |--------------------|--------------------------|------------------------|---------------------| | 自赋值检查 | 简单直接 | 无法防御异常 | 一般赋值操作 | | 拷贝交换惯用法 | 强异常安全保证 | 需要额外实现swap函数 | 需要高安全性的场景 | | 先复制后释放 | 直观易理解 | 需手动管理临时资源 | 简单资源管理类 | #### 扩展方案:拷贝交换惯用法 (Copy-and-Swap) ```cpp void swap(String& other) noexcept { std::swap(str_, other.str_); std::swap(len_, other.len_); } String& operator=(const String& other) { String temp(other); // 利用拷贝构造函数 swap(temp); // 交换资源(强异常安全保证) return *this; } ``` --- ### 五、Clang-Tidy 相关检查项 可通过以下编译选项控制相关检查: ```bash # 显式启用自赋值检查 clang-tidy -checks=&#39;-*,cppcoreguidelines-c-copy-assignment-signature,misc-unconventional-assign-operator&#39; ... # 禁用特定检查 clang-tidy -checks=&#39;-cppcoreguidelines-c-copy-assignment-signature&#39; ... ``` --- ### 六、最佳实践总结 1. **强制自赋值检查**:所有赋值运算符首行必须包含 `if (this == &other) return *this;` 2. **资源操作顺序**:遵循"先获取新资源,再释放旧资源"原则 3. **移动操作安全**:即使移动赋值也应检查自赋值,因为 `std::move(x) = std::move(x)` 语法上合法 4. **单元测试覆盖**: ```cpp TEST(StringTest, SelfAssignment) { String s("test"); s = s; // 必须保证操作后对象仍有效 EXPECT_STREQ(s.c_str(), "test"); } ``` --- 通过正确处理自赋值场景,可以显著提升代码的健壮性,避免隐蔽的内存错误。该问题看似简单,却是C++资源管理类的核心质量指标之一。
评论 5
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值