【西瓜书笔记】第八&九章

怡宝怡宝

于 2024-11-17 18:17:53 发布

阅读量411

点赞数 4

分类专栏：机器学习文章标签：笔记机器学习

本文链接：https://blog.youkuaiyun.com/hiahiakk/article/details/143835994

版权

5 篇文章

订阅专栏

理想的集成模型需要个体学习器既要准确，又要多样（好而不同）。

但是这两者存在冲突：

核心问题：如何在准确性和多样性之间找到平衡，产生“好而不同”的学习器？

Boosting

逐步修正错误样本的权重，通过一系列弱学习器的组合，提升整体模型性能。

AdaBoost

Boosting的一种，通过动态调整样本权重，更多注意难分类样本，构建强学习器。

Bagging

通过多次随机采样生成子训练集，独立训练多个模型，并综合预测结果以降低方差和提升模型稳定性。

随机森林

Bagging的改进版本，引入特征随机性，结合多个决策树模型，提升泛化能力和抗噪性。

聚类目标：将数据集中的样本划分为若干个通常不相交的子集

外部指标

指标	公式	取值范围	越大越好？
Jaccard 系数	JC=aa+b+cJ*C=a+b+c*a	[0, 1]	是
FM 指数	FMI=aa+b⋅aa+cFM*I=a+b*a⋅a+ca	[0, 1]	是
Rand 指数	RI=a+d(m2)RI=(2m)a+d	[0, 1]	是

内部指标

原型聚类

密度聚类

层次聚类