应用 minist分类 一、输出层到隐藏层的推导 输出层的矩阵P为train_number×10 距离输出层最近的隐藏层X为train_number*100 更新权重公式为 X T ∗ P X^T*P X