从0开始机器学习--Day6--逻辑回归自己决策界限

假设陈述(Hypothesis representation)

在上一篇的最后,我们提到想要解决分类问题,我们想要函数的输出保持在[0,1]里,为了解决这个问题,我们提出一个假设函数:h_{\theta}(x)=g(\theta^{T}x),其中将g函数定义为:如果z是一个实数,那么g(z)=\frac{1}{1+e^{-z}},这个函数就叫做sigmoid函数或logistic函数,将其带入到假设函数中,我们会得到:h_{\theta}(x)=\frac{1}{1+e^{-\theta^{T}x}},而g函数图像如下图所示:

g函数图像

如图,我们可以观察到图像是一条过点(0,0.5)的曲线,最重要的是,他有我们想要应用在分类问题上的输出:他的y值始终在(0,1)之间。

回到之间所说的肿瘤问题,假设我们将一个特征量x喂给我们的假设函数,即\begin{bmatrix} x_{0}\\ x_{1} \end{bmatrix} = \begin{bmatrix} 1 \\ tumorSize \end{bmatrix},假设输出是0.7,这就代表输入了这个肿瘤的信息之后,函数告诉我们这个肿瘤有70%的可能性是恶性肿瘤。如果用概率的方式来表达则是h_{\theta}(x)=P(y=1|x;\theta),意思是在给定x的条件下y=1的概率,概率的参数是\theta。由于y的值只可能是0或1,所以P(y=0|x;\theta)=1-P(y=1|x;\theta)

决策界限(Decision boundary)

对于上面提到的假设函数,我们把其分成两种情况可能以便我们对y值进行预测:若h_{\theta}(x)\geq0.5,认为y更有可能偏向1而不是0;反之若h_{\theta}(x)<0.5,则认为其更偏向0。但问题的关键在于,什么时候h_{\theta}(x)\geq0.5呢?

g函数的图像我们可以看到,当z\geq0g(z)\geq0.5,也就意味着只要\theta^{T}x\geq0,就能满足我们所说的h_{\theta}(x)\geq0.5,从而预测y=1。类似的,当\theta^{T}x<0时,我们也能预测到y=0

假设我们有这样一个已经拟合好的数据集,他满足假设函数h_{\theta}(x)=g(\theta_{0}+\theta_{1}x_{1}+\theta_{2}x_{2}),拟合后的参数\theta = \begin{bmatrix} -3\\ 1 \\ 1 \end{bmatrix},那么按照我们上面所说,只要满足-3+x_{1}+x_{2}\geq0,就能得到y=1的预测值。也就是说,我们画出训练集的坐标图,以x_{1}+x_{2}=3为分界线,在线的右边便是满足条件的点,而这条线也就被叫做决策边界,如图:

将正负样本通过决策边界划分出来

需要注意的是,决策边界是由假设函数的参数决定的,与数据集本身无关,即使去掉了这些数据点,决策边界以及划分的区域依然存在。

我们接着来看一个更复杂的例子,还是跟之前一样用×代表证样本,圆圈代表负样本,横坐标轴是x_{1},纵坐标轴是x_{2},如图:

复杂函数的决策边界

其假设函数为h_{\theta}(x)=g(\theta_{0}+\theta_{1}x_{1}+\theta_{2}x_{2}+\theta_{3}x_{1}^{2}+\theta_{4}x_{2}^{2}),假设我们已经使用某种算法去拟合,得到的参数\theta=\begin{bmatrix} -1 \\ 0 \\ 0 \\ 1 \\ 1 \end{bmatrix},,也就是说当x_{1}^{2}+x_{2}^{2}\geq1,预测值y=1,显然,这个直线的意义便是取圆心为原点,半径为1的圆线上及圆以外的点,其预测值y=1

。这个例子告诉我们,通过在假设函数中加入复杂的多项式,我们可以得到更复杂的决策边界,而不只是仅仅用直线分开正负样本。当然,加入更复杂的高阶多项式,得到的决策边界也会长得更加“奇怪”,能够更准确的分开正负样本。

学习内容来自于b站吴恩达大佬课程:https://www.bilibili.com/video/BV1By4y1J7A5?spm_id_from=333.788.player.switch&vd_source=867b8ecbd62561f6cb9b4a83a368f691&p=1

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值