
数据挖掘
文章平均质量分 88
oppeuro
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
PrefixSpan算法详解
序列模式的概念最早是由Agrawal和Srikant 提出的。 动机:大型连锁超市的交易数据有一系列的用户事务数据库,每一条记录包括用户的ID,事务发生的时间和事务涉及的项目。如果能在其中挖掘涉及事务间关联关系的模式,即用户几次购买行为间的联系,可以采取更有针对性的营销措施。原创 2016-12-12 21:24:26 · 7511 阅读 · 2 评论 -
AdaBoost算法详解
AdaBoost算法 训练数据集 初始化训练数据的权值分布 对M=1,2,…,m 使用具有权值分布Dm的训练数据集学习,得到基本分类器: 计算Gm(x)在训练数据集上的分类误差率: 计算Gm(x)的系数 更新训练数据集的权值分布: Zm是规范化因子: 构建基本分类器的线性组合 AdaBoost说明:原创 2016-12-20 20:31:32 · 3193 阅读 · 0 评论 -
AdaBoost
AdaBoost 算法介绍 AdaBoost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器), 然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。 AdaBoost算法本身是通过改变数据分布来实现的,它根据每次训练集之中每个样本的分类是否正确, 以及上次的总体分类的准确率,来修改每个样本的权值。将修改过权值的新数据集送给下层分类器进行训练, 最原创 2016-12-20 20:51:59 · 441 阅读 · 0 评论