机器学习速成课程笔记2:深入了解机器学习 (Descending into ML)-线性回归

本文介绍了一种使用蟋蟀鸣叫频率预测温度的方法。通过图表分析发现两者间存在线性关系,进而利用线性回归模型进行预测。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

smile.gifuploading.4e448015.gif转存失败重新上传取消微笑快速翻阅,快速学习     

    人们早就知晓,相比凉爽的天气,蟋蟀在较为炎热的天气里鸣叫更为频繁。数十年来,专业和业余昆虫学者已将每分钟的鸣叫声和温度方面的数据编入目录。Ruth 阿姨将她喜爱的蟋蟀数据库作为生日礼物送给您,并邀请您自己利用该数据库训练一个模型,从而预测鸣叫声与温度的关系。

 首先建议您将数据绘制成图表,了解下数据的分布情况:

 

 

图 1. 每分钟的鸣叫声与温度(摄氏度)的关系。

毫无疑问,此曲线图表明温度随着鸣叫声次数的增加而上升。鸣叫声与温度之间的关系是线性关系吗?是的,您可以绘制一条直线来近似地表示这种关系,如下所示:

 

 

图 2. 线性关系。

事实上,虽然该直线并未精确无误地经过每个点,但针对我们拥有的数据,清楚地显示了鸣叫声与温度之间的关系。只需运用一点代数知识,您就可以将这种关系写下来,如下所示:

                                                                

 

其中:

划重点!!!关键字词:

 

偏差 (bias)

距离原点的截距或偏移。偏差(也称为偏差项)在机器学习模型中以 b 或 w0 表示。例如,在下面的公式中,偏差为 b:

                                                     

请勿与预测偏差混淆

预测偏差 (prediction bias)

一个值,用于表明预测平均值与数据集中值,用于表明预测平均值与数据集中标签的平均值相差

 

线性回归 (linear regression)

一种回归模型,通过将输入特征进行线性组合,以连续值作为输出。

推断 (inference)

在机器学习中,推断通常指以下过程:通过将训练过的模型应用于无标签样本来做出预测。在统计学中,推断是指在某些观测数据条件下拟合分布参数的过程。(请参阅维基百科中有关统计学推断的文章。)

 

权重 (weight)

线性模型中特征的系数,或深度网络中的边。训练线性模型的目标是确定每个特征的理想权重。如果权重为 0,则相应的特征对模型来说没有任何贡献。

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值