1、学习率:是常数,如果太大,可能跨过极值点,设置太小,容易陷入局部最优,
2、numepochs 根据输出误差返回调整神经元权值和阈值的次数
3、归一化视为了限定输入向量的最大值和最小值不超过隐层的限定范围。
4、batchsize 是批大小,即batchsize=50,迭代一次就50个样本
5、rem(x,y) x/y的余数 结果跟x的符号一致
mod(x,y) 求模 结果跟y的符号一致
randperm 随机打乱一个数字序列
6、squeeze除去size为1的维度,如果rand(4,2,3)没有1,的维度,squeeze后没有变化。
prod 计算数组元素的连乘积
numel(A)返回数组A中元素个数