李航《统计学习方法》第一章习题和笔记

最新推荐文章于 2025-03-04 20:20:40 发布

赶只鸡

最新推荐文章于 2025-03-04 20:20:40 发布

阅读量1k

点赞数 2

分类专栏：统计学习文章标签：统计学习方法参数估计

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qiutiantxwd/article/details/85802978

版权

《统计学习方法》第一章习题和笔记

关键概念
个人习题解答
遗留问题

关键概念

统计学习三要素
一切统计学习方法可以由三要素描述：模型 + 策略 + 算法
模型
根据想要学习的目标，模型可以分为概率模型和非概率模型。概率模型是指从输入空间X到输出空间Y的映射是通过条件概率来描述的。非概率模型一般就是由决策函数来描述X到Y的映射。
策略
要学习一个模型，从直观上就是要让这个模型对映射的描述越来越准确。要度量这个准确性，就需要引入一些对于模型不准确程度的衡量标准，也就是损失函数。很显然，针对训练集，损失函数越小，模型就越准确，但是可能会带来过拟合的问题，导致在测试集上表现很差。所以一般有两种策略：经验风险最小化（只考虑训练集的表现）和结构风险最小化（加入正则化，抵抗过拟合）
算法
通过确定策略，已经确定了一个需要被优化的函数，优化函数的具体计算方法，称为算法。机器学习里算法之所以关键，主要是因为大多数优化问题都没有显式解，所以需要好的数值计算方法进行优化。
参数估计复习
概率论中的参数估计，目前用到了两种，点估计和贝叶斯估计。
点估计就是指决定某个分布的参数 $\theta$ 被看做是一个确定的未知数，并且用一个数（而不是一个区间）来估计这个未知数。
贝叶斯估计认为这个参数是符合某种分布的。当我们对这个分布没有进行过观察的时候，对这个分布仅仅有一个朴素的没有偏向的认识，称为先验分布。在进行了一次或多次观察之后，我们得到了一些新的信息，这个信息有助于我们去修改之前对这个分布的估计，修改完的分布称为后验分布。

个人习题解答

伯努利模型的点估计和贝叶斯估计
1.1 点估计
模型：伯努利模型描述了一个取值为0或1的离散型随机变量 $X$ 进行一次实验的结果。
策略：极大似然估计的思路是[1]，对于分布 $f(x;\theta_1,... ,\theta_k)$ 有独立同分布的观察样本 $X_1, ...,X_n$ 。将 $\theta$ 视为未知的参数，则得到这一系列观察样本 $X_1, ..., X_n$ 的联合概率为 $L(X_1, ..., X_n;\theta_1, ..., \theta_k)$ 。联合概率 $L$ 的大小取决于 $\theta_i$ 的不同取值。
那么，使用目前的观察进行估计，哪个 $\theta_i$ 的取值是最可能的呢？极大似然估计认为，使联合概率分布取最大值的 $\theta_i$ 是最可能的。数学描述为：
$L(X_1,\cdots, X_n;\theta_1^*,\cdots, \theta_k^*) = \max \limits_{\theta_1, \cdots, \theta_k}L(X_1, \cdots, X_n;\theta_1, \cdots, \theta_k)$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。