
机器学习
江南小白龙
这个作者很懒,什么都没留下…
展开
-
【机器学习系列1】Xgboost算法
http://skyhigh233.com/blog/2016/12/01/gbdt-and-xgboost/RF、GBDT和xgboostRF:从M个训练样本中随机选取m个样本,从N个特征中随机选取n个特征,然后建立一颗决策树。这样训练出T棵树后,让这k颗树对测试集进行投票产生决策值。RF是一种bagging的思路。可以并行化处理。GBDT:总共构建T棵树转载 2017-08-30 20:12:04 · 755 阅读 · 0 评论 -
【机器学习系列2】FPGrowth算法与spark实现
原理基础支持度支持度是指在所有项集中{X, Y}出现的可能性,即项集中同时含有X和Y的概率: 该指标作为建立强关联规则的第一个门槛,衡量了所考察关联规则在“量”上的多少。置信度置信度表示在先决条件X发生的条件下,关联结果Y发生的概率: 这是生成强关联规则的第二个门槛,衡量了所考察的关联规则在“质”上的可靠性。提升度提升度表示在含有X的条件下同时含有Y的可转载 2017-09-07 17:22:17 · 3635 阅读 · 0 评论