下面只是方便理解,在神经网络的实现中,假定输入XX,每一行是一个样本,即形状可以表示为n×d1n×d1, 其经过线性层得到YY,其每一行是一个样本,则形状可以表示为n×d2n×d2,则用公式可以表示为:
Y=X∗WY=X∗W
形状为:
n×d2=n×d1∗d1×d2n×d2=n×d1∗d1×d2
理解反向传播的矢量化:
下面只是方便理解,在神经网络的实现中,假定输入XX,每一行是一个样本,即形状可以表示为n×d1n×d1, 其经过线性层得到YY,其每一行是一个样本,则形状可以表示为n×d2n×d2,则用公式可以表示为:
理解反向传播的矢量化: