线性神经网络——线性回归模型
为了更好的学习深度神经网络,本文介绍了线性神经网络中较为简单的线性回归模型,并演示了神经网络的整个训练过程,包括:定义简单的神经网络架构、数据处理、指定损失函数和如何训练模型。模型相对简单,但包含深度学习中模型训练的基本思想,为以后学习更复杂的模型打下基础。
一、线性回归模型基本概念
回归(regression)是能为一个或多个自变量与因变量之间关系建模的一类方法。在自然科学和社会科学领域,回归经常用来表示输入和输出之间的关系。在机器学习领域大多数任务通常与预测(prediction)有关,常见的例子包括:预测价格(房屋、股票等)、预测住院时间(针对住院病人等)、预测需求(零售销量等)。
1. 数据集
通过一个例子来介绍线性回归模型中的基本元素,我们希望根据房屋的面积(平方英尺)和房龄(年)来估算房屋价格(美元)。为了开发一个能预测房价的模型,我们需要收集一个真实的数据集(包括房屋销售价格、面积、房龄),该数据集就被称为训练集(training set),数据集中的每一行数据称为样本(sample)。我们需要预测的目标(房屋价格)称为标签(label),预测所依据的自变量(面积和房龄)称为特征(feature)。
- 训练集:训练模型使用的真实数据集
- 样本:数据集中的数据
- 特征:数据的特征
- 标签:预测的目标
2. 线性模型
线性模型简单说就是带有未知参数的一个函数,这个函数反映了自变量和因变量之间的线性关系,拿上面的例子来建立一个房屋价格的线性回归模型如下:
price=warea⋅area+wage⋅age+b \mathrm{price}=w_{\text{area}}\cdot\text{area}+w_{\text{age}}\cdot\text{age}+b price=warea⋅area+wage⋅age+b
整个函数是一种线性的映射关系(特征和价格)。这个式子就是指目标(房屋价格)可以表示为特征(面积和房龄)的加权和,其中的wareaw_{\mathbf{area}}warea和wagew_{\mathbf{age}}wage称为权重(weight),为了函数更符合实际情况,在函数最后加上一个偏移量bbb我们称为偏置(bias)。
- 权重:每个特征对预测值的影响程度
- 偏置:偏置是指当所有特征都取值为0时,预测值应该为多少
将函数数学化,用y^\hat{y}y^表示预测结果,当模型包含ddd个特征时表示为:
y^=w1x1+...+wdxd+b \hat{y}=w_1x_1+...+w_dx_d+b
线性回归模型原理与训练过程详解

最低0.47元/天 解锁文章
1077

被折叠的 条评论
为什么被折叠?



