python加速技巧

最新推荐文章于 2022-03-22 10:32:42 发布

qq_39643868

最新推荐文章于 2022-03-22 10:32:42 发布

阅读量229

点赞数

文章标签： python

原文链接：https://mp.weixin.qq.com/s?__biz=MzU1NTE4OTAyNg==&mid=2247487523&idx=2&sn=8f2e0a097932773f1a6f679795eb543d&chksm=fbd9466eccaecf78b2af2ab5c4e0d23dfaae452c8dbae97cfe7d0a3e10a8d07d385296c11cf3&mpshare=1&scene=24&srcid=0731110WLGWDxZuYUHXBsiny&sharer_sharetim

版权

代码优化原则

不要过早优化。
权衡优化代价
忽视不关紧要的部分

避免全局变量

通过将脚本语句放入到函数中，通常可带来 15% - 30% 的速度提升。

避免模块和函数属性访问

每次使用.（属性访问操作符时）会触发特定的方法，如__getattribute__()和__getattr__()，这些方法会进行字典操作，因此会带来额外的时间开销。通过from import语句，可以消除属性访问。

避免类内属性访问

避免.的原则也适用于类内属性，访问self._value的速度会比访问一个局部变量更慢一些。通过将需要频繁访问的类内属性赋值给一个局部变量，可以提升代码运行速度。

避免不必要的抽象

任何时候当你使用额外的处理层（比如装饰器、属性访问、描述器）去包装代码时，都会让代码变慢。大部分情况下，需要重新进行审视使用属性访问器的定义是否有必要，使用getter/setter函数对属性进行访问通常是 C/C++ 程序员遗留下来的代码风格。如果真的没有必要，就使用简单属性。

避免数据复制

1.避免无意义的数据复制
2.交换值时不使用中间变量
3.字符串拼接用join而不是+
4.利用if条件的短路特性
if 条件的短路特性是指对if a and b这样的语句，当a为False时将直接返回，不再计算b；对于if a or b这样的语句，当a为True时将直接返回，不再计算b。因此，为了节约运行时间，对于or语句，应该将值为True可能性比较高的变量写在or前，而and应该推后。

循环优化

1.用for循环代替while循环
2.使用隐式for循环代替显式for循环
3.减少内层for循环的计算
上面的代码中sqrt(x)位于内侧for循环，每次训练过程中都会重新计算一次，增加了时间开销。
4.使用numba.jit
numba可以将 Python 函数 JIT 编译为机器码执行，大大提高代码运行速度。
关于numba的更多信息

选择合适的数据结构

Python 内置的数据结构如str, tuple, list, set, dict底层都是 C 实现的，速度非常快，自己实现新的数据结构想在性能上达到内置的速度几乎是不可能的。

list类似于 C++ 中的std::vector，是一种动态数组。其会预分配一定内存空间，当预分配的内存空间用完，又继续向其中添加元素时，会申请一块更大的内存空间，然后将原有的所有元素都复制过去，之后销毁之前的内存空间，再插入新元素。删除元素时操作类似，当已使用内存空间比预分配内存空间的一半还少时，会另外申请一块小内存，做一次元素复制，之后销毁原有大内存空间。因此，如果有频繁的新增、删除操作，新增、删除的元素数量又很多时，list的效率不高。此时，应该考虑使用collections.deque。collections.deque是双端队列，同时具备栈和队列的特性，能够在两端进行复杂度的插入和删除操作。

list的查找操作也非常耗时。当需要在list频繁查找某些元素，或频繁有序访问这些元素时，可以使用bisect维护list对象有序并在其中进行二分查找，提升查找的效率。

另外一个常见需求是查找极小值或极大值，此时可以使用heapq模块将list转化为一个堆，使得获取最小值的时间复杂度是。

Python 数据结构的各项操作的时间复杂度