1. 二元分类
1.1 logistic模型
首先,我们需要搞清楚二元分类模型与之前的线性回归模型的区别。之前的线性回归模型是预测连续输出,对应的典型问题就是预测房价。而现在的二元分类问题是预测一个离散的输出,只关心有无,对应的典型问题就是预测有无癌症。二元分类问题只需要选取一个阈值,超过这个阈值就是y=1y=1,低于这个阈值就是y=0y=0。并且预测分析的输出最好是在[0,1][0,1]这个范围之内的,因为毕竟训练数据集中的输出也只有00和
。
根据上面分析,二元分类问题对于hθ⃗ (x⃗ )hθ→(x→)有一个要求:
hθ⃗ (x⃗ )∈[0,1]hθ→(x→)∈[0,1]
而logistic函数就有这样优秀的性质。我们令