- 以老鸭汤的口味作为标签,原料作为特征因素,
- y = w1x1 + w2x2 + w3x3 + …… + wnwn + b
- 各种原料对老鸭汤口味的重要性通过 wn*xn 的值来体现,单一的 wn 或者 xn 不能体现原料对口味的影响程度
- 原材料对口味的影响程度有着巨大的差异,假设老鸭汤要放 5g 的盐 和 1000g 的水,盐的重要性远远大于水,模型在训练的过程中就会疯狂增大盐前面的系数,以此来体现盐的重要性,而水前面的系数将会非常小
- wn 疯狂增大或减少,计算机就有可能算不出结果返回 NAN,导致模型训练失败
- 由上述可知:特征因素值的大小对其影响程度而言是没有意义的,而且由于取值的巨大差异(5g 盐 和 1000g 水)会大大增加计算机的计算负担
- 既然这样,那就可以把 xn 归一化
- 那么特征因素的系数 wn 就可以大致可以体现原料对口味的影响程度,而且大大的降低了计算成本(xn <= 1),不会出现无法计算的情况