1. caffe inner product的计算
这里以M为1的情况进行讨论。
默认情况下,weight的transpose_ == 0,也就是说 weight是 N行K列的矩阵。
这样做GEMM时,需要告诉BLAS,对weight进行主动转置。
但如果要用GEMV时,就不需要对weight做转置了,因为weight是 N * K的矩阵,bottom是1*K的向量,直接乘法就行。
有一点需要注意,因为优化的原因,向量和矩阵的乘法,GEMM和GEMV的值会有小数点4位后的一些差异。也就是精度最高在万分之一。
本文深入探讨Caffe框架中内积层的计算原理,特别关注M为1时的特殊情况。解析weight矩阵如何影响GEMM和GEMV运算,并指出在不同运算下对weight是否需要转置的要求。同时,文章提及向量与矩阵乘法中,GEMM和GEMV计算结果可能存在小数点后四位的精度差异。
5537

被折叠的 条评论
为什么被折叠?



