2、工程师统计学习入门

工程师统计学习入门

1. 统计学习基础概念

统计学习旨在从数据中估计未知函数,回归、分类和预测这三个基本问题都可归结为这一通用任务,因此它们所使用的基本学习方法颇为相似。

1.1 样本统计量

对于随机变量 (U) 和 (V),样本协方差 (\hat{c} {UV}) 和样本相关系数 (\hat{r} {UV}) 定义如下:
- 样本协方差:(\hat{c} {UV} = \frac{1}{N} \sum {j=1}^{N} (U_j - \hat{\mu} U)(V_j - \hat{\mu}_V) \to cov (U, V))
- 样本相关系数:(\hat{r}
{UV} = \frac{\hat{c}_{UV}}{\sqrt{\hat{\sigma}_U^2 \hat{\sigma}_V^2}} \to corr (U, V))

其中,(\hat{\mu}_U)、(\hat{\mu}_V) 分别是 (U) 和 (V) 的样本均值,(\hat{\sigma}_U^2)、(\hat{\sigma}_V^2) 分别是 (U) 和 (V) 的样本方差,当 (N \to \infty) 时,上述估计收敛到真实的协方差和相关系数。

此外,还有一些方法可用于量化随机变量间的一般(非线性)依赖关系,如互信息,但这些方法需要知道随机变量 (U) 和 (V) 的联合分布信息。

1.2 多元正态分布

对于 (d) 维随机向量,多元正态分布起着类似于实值随机变量中正态分布的作用。其概率密度函数为:
[p(x) = \

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值