C++性能优化笔记-15-测试执行速度

^Moon^

已于 2023-11-03 17:16:12 修改

阅读量1k

点赞数

分类专栏：架构与开发技巧程序优化 c++ 文章标签： c++ 性能测试

于 2021-09-27 19:00:32 首次发布

本文链接：https://blog.youkuaiyun.com/yelede2009/article/details/120513239

版权

本文探讨了在软件开发中测试和优化代码的重要性，尤其是关注CPU执行速度和缓存效率。通过使用时间戳计数器和性能监视器计数器来测量代码性能，作者强调了测试最坏情况和单元测试的陷阱。此外，还提到了如何在最坏情况下测试性能，确保在资源受限或高负载时仍能保持良好的响应时间。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

测试程序的速度是优化工作的一个重要部分。你必须检查你的修改是否确实提高了速度。

有各种各样的分析器可用于查找热点和测量程序的总体性能。然而，分析器并不总是准确的，当程序花费大部分时间等待用户输入或读取磁盘文件时，可能很难准确测量您想要的内容。有关分析的讨论，请参见执行时间分析。

确定热点后，隔离热点并仅对代码的这一部分进行测量可能很有用。这可以通过使用所谓的时间戳计数器获取CPU时钟周期来完成。这是一个计数器，用于测量CPU启动后的时钟脉冲数。时钟周期的长度是时钟频率的倒数，参见执行时间分析。如果在执行一段关键代码之前和之后读取时间戳计数器的值，则可以获得两个时钟计数之间的差作为确切的时间消耗。
。。。

测量的时间按以下方式解释。第一次计数通常高于后续计数。这是在代码和数据未缓存时执行CriticalFunction所需的时间。随后的计数给出了代码和数据缓存后的执行时间。第一次计数和后续计数分别表示“最坏情况”和“最佳情况”值。这两个值中哪一个最接近真值取决于在最终程序中是调用CriticalFunction一次还是多次，以及在调用CriticalFunction期间是否有其他代码使用缓存。如果你的优化工作集中在CPU效率上，那么应该查看“最佳情况”计数，以确定某个修改是否有效。另一方面，如果你的优化工作集中在安排数据以提高缓存效率，那么还可以查看“最坏情况”计数。在所有情况下，时钟计数应乘以时钟