1. Non-linear Hypotheses
运用逻辑回归来处理多特征的问题时,会发现其表达式非常复杂,多项式的项数随着特征个数的平方次增长,这就很难进行计算与拟合了。所以需要一种非线性假设,神经网络就提供了这样一种解决方案。
2. Neural Networks
神经网络在每一层对每一个输入节点都乘以一个参数θ(或者说权重),然后加上这一层的偏置,并经过sigmoid函数的处理来得到下一层的一个节点,循环来得到下一层的每一个节点的值,这种计算式也可以写成矩阵的形式。
矩阵形式的推导如下图:
3. Multiclass Classification
多元分类的输出结果不止一个,最终的输出结果也可以用一个列向量来表示,具体可见练习ex3。