1.矩阵分解法
矩阵分解法被广泛地应用于线性模型的加速以及参数的压缩上,具体方法是使用奇异值分解的方式对参数矩阵进行分解。奇异值分解有很明显的物理意义,即它可以将一个复杂矩阵用几个小矩阵相乘来表示,这些小的矩阵描述的是复杂矩阵的重要特征。例如,给定一个参数矩阵,可以将其分解为。这里
、
里面的向量称为左奇异向量和右奇异向量,而且向量是两两正交的。通过方阵
可以求得特征值
,这里的
为右奇异向量。再通过公式
,
求出奇异值
和左奇异向量
。选取U,V矩阵中的前k个奇异向量,以及其对应的奇异值来近似的描述参数矩阵W。于是近似矩阵
可以表示为
。
SVD(奇异值分解)的逼近受S中特征值衰减的控制,SVD方法在Frobenius范数意义下是最优的,使逼近矩阵与原始W之间的最小均方误差最小。为了表示原始矩阵W,只需要将
,