21、数据分析中的线性模型与计数比例数据建模

数据分析中的线性模型与计数比例数据建模

1. 线性模型统一概念

线性模型有一个有用的统一概念,每个线性模型都可以写成 $y_i = E[y_i|x_i] + \epsilon_i$,其中 $\epsilon_i \sim N(0, \sigma^2)$。$E[y_i|x_i]$ 的形式会根据解释变量的性质或特定的建模框架而变化,但其形式对于线性模型始终是线性的。具体形式如下表所示:
| 变量情况 | 技术 | $E[y_i|x_i]$ |
| — | — | — |
| 一个连续变量 | 简单线性回归 | $\beta_0 + \beta_1x_i$ |
| 一个因子 | 单因素方差分析 | $\mu + \alpha_i$ |
| 两个因子 | 双因素方差分析 | $\mu + \alpha_i + \beta_j + (\alpha\beta) {ij}$ |
| 两个或更多变量:连续变量和因子的混合 | 多元回归 | $\beta_0 + \beta_1x
{1i} + \cdots + \beta_px_{pi}$ |

这个统一概念有两个好处:一是让我们看到每个线性模型都有相同的形式,因此在每次分析中都可以使用相同的工具;二是清楚地表明我们是将给定 $x_i$ 时 $y_i$ 的均值(或期望值)建模为解释变量的线性函数。

2. ANOVA 恒等式

每个模型(线性或非线性)都可以看作“DATA = SIGNAL + NOISE”。从统计学角度来看,这意味着将数据的变异性归因于不同的来源。在线性模型中,这一概念体现在 ANOVA 恒等式中:
$Total SS

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值