向量化是非常基础的去除代码中for循环的艺术,在深度学习安全领域、深度学习实践中,你会经常发现自己训练大数据集,因为深度学习算法处理大数据集效果很棒,所以代码的运行速度非常重要。否则在数据集很大时,代码需要花费很长时间去处理。在深度学习领域,运行向量化是一个关键的技巧。
1. 向量化
举一个例子说明什么是向量化:
在逻辑回归中需要计算 z = w T x + b z = w^Tx + b z=wTx+b 。其中 w w w 和 x x x 都是列向量。如果样本有很多特征,那么该列向量将会非常大。如果使用的是非向量化方法去计算该式,则代码如下:
z=0
for i in range(n_x):
z+=w[i]*x[i]
z+=b
这是一个非向量化的实现,你会发现这真的很慢,作为一个对比,向量化实现将会直接计算
w T x w^Tx wTx,其代码如下:
z=np.dot(w,x)+b
这是向量化的实现方法,你将会发现这个非常快。为了更加直观的对比向量化实现方法与非向量化实现方法的运行速度,在jupyter中输入以下示例:
import numpy as np
a=np.array([1,2,3,4])
a # array([1, 2, 3, 4])
2. 向量化实现
在下例中,通过random随机得到两个一百万维的数组,并记录下在实现向量化之前以及之后的时间,相减得到运行时间: