Linear regression(线性回归)

本文介绍了监督学习的基本概念,并详细探讨了线性回归问题。文章解释了如何通过训练数据集学习模型,以便根据输入变量预测连续的目标值。此外,还讨论了损失函数及其在模型评估中的作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在实际生活中,我们常常需要根据已知的某些知识来预测未知的知识。例如我们可能需要根据房子的住宿面积来预测房子的销售价格,在这个问题中,已知的知识就是房子的住宿面积,未知的知识就是房子的销售价格。对于supervised learning来说,首先会拥有一个训练数据集training data。我们的任务就是从training data中学习到一个尽可能好的模型,可以对现实世界进行相关预测。
在预测问题中,如果要预测的变量(target value)取值是连续的,这个问题就叫做回归问题(regression),如果target value是离散的就称之为分类问题(classification)。
在预测问题中,我们将输入数据记为X,输出记为Y,我们的任务就是找到一个足够好的函数h:X—>Y。
(一)线性回归
如果我们预测的回归函数h是输入变量的线性组合,那么就称该问题为一个线性回归问题。即函数形式为:
当我们得到预测函数时,将对我们的预测做出评价。一种简单的评价就是看我们做出的预测和我们已知的训练数据之间的差异。可以使用损失函数进行评价。损失函数可以定义为:

 这里的损失函数使用了普通的最小二乘法定义。
 我们选择模型的过程就是确定θ 的过程,我们的目标是选择使J(θ)尽可能小的θ 。在确定θ 是常使用梯度下降法得到。

在实际生活中,我们常常需要根据已知的某些知识来预测未知的知识。例如我们可能需要根据房子的住宿面积来预测房子的销售价格,在这个问题中,已知的知识就是房子的住宿面积,未知的知识就是房子的销售价格。对于supervised learning来说,首先会拥有一个训练数据集training data。我们的任务就是从training data中学习到一个尽可能好的模型,可以对现实世界进行相关预测。
在预测问题中,如果要预测的变量(target value)取值是连续的,这个问题就叫做回归问题(regression),如果target value是离散的就称之为分类问题(classification)。
在预测问题中,我们将输入数据记为X,输出记为Y,我们的任务就是找到一个足够好的函数h:X—>Y。
(一)线性回归
如果我们预测的回归函数h是输入变量的线性组合,那么就称该问题为一个线性回归问题。即函数形式为:
当我们得到预测函数时,将对我们的预测做出评价。一种简单的评价就是看我们做出的预测和我们已知的训练数据之间的差异。可以使用损失函数进行评价。损失函数可以定义为:

 这里的损失函数使用了普通的最小二乘法定义。
 我们选择模型的过程就是确定θ 的过程,我们的目标是选择使J(θ)尽可能小的θ 。在确定θ 是常使用梯度下降法得到。

转载:http://blog.youkuaiyun.com/dengzhilong_cpp/article/details/7292779

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值