回归分析:从线性回归到不同损失函数的实现
1. 回归的定义
“回归”在计量经济学和机器学习中的常用定义有所不同。在计量经济学中,回归涉及估计将因变量与自变量联系起来的参数值,最常见的形式是多元线性回归,用于估计连续因变量与多个自变量之间的线性关联,不过该术语也涵盖非线性模型和因变量为离散值的模型。而在机器学习中,回归指的是具有连续因变量(目标)的线性或非线性监督学习模型。本文将采用计量经济学中更广泛的回归定义,并引入机器学习中常用的方法。
2. 线性回归概述
线性回归在系数线性的假设下,对因变量 $Y$ 和一组自变量 ${X_0, \ldots, X_k}$ 之间的关系进行建模。线性要求每个 $X_j$ 与 $Y$ 之间的关系可以用一个由标量系数 $\beta_j$ 表示的恒定斜率来建模。以下是不同情况下线性模型的表达式:
- 一般线性模型 :
- 对于有 $k$ 个自变量的线性模型,其一般形式为:$Y = \alpha + \beta_0X_0 + \cdots + \beta_{k - 1}X_{k - 1}$
- 带实体索引的线性模型 :
- 明确为每个观测指定索引时,例如 $Y_i$ 表示实体 $i$ 的变量 $Y$ 的值,模型为:$Y_i = \alpha + \beta_0X_{i0} + \cdots + \beta_{k - 1}X_{ik - 1}$
- 带实体和时间索引的线性模型 :
- 在经济问题中,常使用时间索引,用 $t$ 下标表示变量观测的时间段,模型为:$Y_{it} = \
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



