前言
近期推动项目屎山代码进行了一波性能优化,实现了较大的性能提升。这里记录了部分近期代码优化的小技巧,这些例子仅从C++语言层面进行优化,主要在于优化类设计、减少隐含函数调用、减少拷贝等,较为基础实用,但涉及的知识点并不少。本文提供了一个视角,可以帮助了解一些C++代码的不同写法性能开销差异。对于很少关注代码性能的人,或许可以看看,提升一下代码性能方面的意识,从而写出性能更高的程序。
1. 使用const引用传递而非值传递
通过值传递给函数时会创建临时变量。
void process(vector<int> s);
改为引用传递:
void process(const vector<int>& s);
- 如果参数对象较大,使用值传递时拷贝的代价大,应该使用引用传递。
- 如果是内置类型int, float, double, char 和 bool,使用值传递,可以支持某一些编译器优化手段。
同理,对类成员访问接口:
Eigen::VectorXd GetStates() const {
return current_states_;
}
应改为返回 const&
,
const Eigen::VectorXd& GetStates() const {
return current_states_;
}
保存函数返回的引用时,为避免拷贝,同样需要引用:
const auto& states = GetStates();
返回引用避免拷贝还需要避免隐式转换的发生,否则还是会拷贝,详见第3条。
2. for循环中使用引用遍历
以下for循环,每次从 object_list
容器拷贝临时对象 obj
,
for(auto obj: object_list) {
obj->func();
}
改为 const auto&
避免拷贝。
for(const auto& obj: object_list) {
obj->func();
}
3. 注意隐式转换带来的拷贝
- 注意const语义不一致带来的隐式转换。
比如在以下代码中, GetObject()
虽然返回引用类型,但由于返回类型的const语义不一致,实际调用该函数后还是会导致返回临时变量。
class Widget {
public:
const std::shared_ptr<const object>& GetObject() {
return object_;
}
private:
std::shared_ptr<Object> object_;
};
-
当函数返回类型和临时值类型具有继承关系时,也会发生隐式转换。 见第10条提到的
RVO
。 -
对容器如
std::unordered_map
等进行遍历时,如果未使用auto,应写出遍历元素的正确类型。
比如for
遍历std::unordered_map
时,每个元素的类型为 std::pair<const key, value>
。以下代码会对pair进行拷贝,原因在于发生了到std::pair<key, value>
的隐式转换,创建了临时对象。
std::unordered_map<int, Widget> umap;
for(const std::pair<int, Widget>& data: umap) {
//...
}
以下代码更加高效,对key添加了 const
修饰符,避免了隐式转换。
std::unordered_map<int, Widget> umap;
for(const std::pair<const int, Widget>& data: umap) {
//...
}
或者尽量使用 const auto&
自动推断类型。
4. 定义即初始化
以下代码会调用一次默认构造函数,一次赋值运算符函数;
Matrix m1; // call default constructor
m1 = m2 + m3; // call Assignment operator
以下代码只会调用一次拷贝构造函数。
Matrix m1 = m2 + m3; // call copy constructor
另一个是 std::shared_ptr
深拷贝的例子,以下代码先对 Object
默认构造后对其赋值;
std::shared_ptr<Object> object = std::make_shared<Object>();
// call default constructor
*object = *(objects_[index]->GetBaseObject());
// call Assignment operator
由于 std::make_shared<T>()
可以支持T的拷贝构造,可直接通过拷贝构造完成。
ObjectPtr object = std::make_shared<Object>(*(objects_[index]->GetBaseObject()));
// call copy constructor
5. 循环中复用临时变量
以下代码在循环中创建、销毁临时变量,多次调用拷贝构造函数和析构函数,
for (const auto& point : object->points) {
Eigen::Vector3d ref_point(0.0, 0.0, 0.0);
ref_point.head(2) = Transform(loc_info, odom_ref_point.head(2));
object->predicted_state.reference_points.emplace_back(ref_point);
}
改为复用临时变量,创建一次,多次复用。
Eigen::Vector3d ref_point(0.0, 0.0, 0.0);
for (const auto& point: object->points) {
ref_point.head(2) = Transform(loc_info, odom_ref_poi