数据挖掘
yebulk
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
数据挖掘——Adaboost
Adaboost就是通过迭代训练若干个弱分类器,直到错误率为零,所有分类器的加权(D)和的sign值就是结果。每一次迭代之后的下一个分类器都更加关注分错类的个体(每一个弱分类器都是通过阈值划分确定的,找到使总体的错误最小的切分方式,即min(D.T*(判断错误为1,正确为0的矩阵)),这一次划分错误的个体权值就会在下一个分类器里权值加强,为了使min(D.T*(判断错误为1,正确为0的矩阵)),所以上一个错误的这次肯定对,但是总体的错误率可能会提高,所以这个弱分类器的权值可能会减小。具体步骤,看代码原创 2020-06-10 00:32:34 · 291 阅读 · 1 评论 -
数据挖掘算法(一)——Apriori
1.关联分析关联分析是一种在大规模中寻找关系的非监督学习算法。这些关系可以有两种形式:频繁项集、关联规则。 频繁项集:经常出现在一块的物品的集合 关联规则:暗示两种物品之间可能存在很强的关系一个例子:在这里,我们不关心顾客买了几件,只关心买了什么,在这里明确几个定义。●事务:每一条交易称为一个事务。例如,在这个例子中包含了5个事务。●项:交易的每一个物品称为一个项,例如,豆奶、尿布等。●项集:包含零个或者多个项的集合叫做项集,例如{豆奶,莴...原创 2020-05-16 00:33:49 · 2090 阅读 · 0 评论
分享