
机器学习
文章平均质量分 81
mach_learn
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Mahout ALS Recommendations
mahout ALS推荐系统不同于mahout基于用户或者基于wupin原创 2014-11-07 15:29:38 · 1954 阅读 · 0 评论 -
scikit-learn使用OneHotEncoder处理Nominal属性的机器学习流程(Random Forest算法为例)
scikit-learn机器学习流程(处理类别属性)原创 2014-10-24 15:33:04 · 14612 阅读 · 1 评论 -
Mahout基于hadoop实现itembased协同过滤流程解析
首先,我们分析mahout itembased协同过滤,必须先找到执行协同过滤的触发类org.apache.mahout.cf.taste.hadoop.item.RecommenderJob。我们通过研读RecommenderJob的代码来了解mahoutitembased协同过滤在hadoop上的实现方式。原创 2014-11-11 18:22:40 · 1341 阅读 · 0 评论 -
深入理解mahout基于hadoop的协同过滤流程
最近做mahout itembased collaborative filtering项目,今天把mahout 协同过滤的流程进行了一下梳理,以便能够更好了解mahout itembased协同过滤设计方式,以及能够对mahout itembased协同过滤源码进行修改。分享一下,希望对大家有所帮助。原创 2014-11-13 11:14:56 · 2421 阅读 · 0 评论 -
机器学习算法优缺点及其应用领域
决策树一、 决策树优点1、决策树易于理解和解释,可以可视化分析,容易提取出规则。2、可以同时处理标称型和数值型数据。3、测试数据集时,运行速度比较快。4、决策树可以很好的扩展到大型数据库中,同时它的大小独立于数据库大小。二、决策树缺点1、对缺失数据处理比较困难。2、容易出现过拟合问题。3、忽略数据集中属性的相互关联。4、ID3算法计算信息增益时结果偏向数值原创 2014-09-23 18:04:53 · 15954 阅读 · 0 评论 -
机器学习工具Weka 使用已知进行实时预测
Weka预测一般使用classifyInstance,或者原创 2014-10-17 14:10:16 · 5577 阅读 · 3 评论 -
spark on yarn运行产生缺jar包错误及解决办法
spark在很多时候由于配置的原因造成缺少jar包的情况,本文介绍了两种缺少jar包情况,并介绍了如何使用spark-submit的--jars和--driver-class-path参数将jar包动态调用。原创 2014-12-09 15:42:05 · 9914 阅读 · 1 评论 -
Spark 基于item和user 的协同过滤实现
mahout已经提供了 item-based cf 算法,但是要想在 mahout 算法上修改item-based cf 相对来说比较繁琐,比如改进相似度或者改进推荐结果计算公式,更加令人头疼的是mahout 修改比较难调试,相比来说 spark 实现起来更加简单方便,同时 spark shell 在调试阶段特别方便。本文使用 spark 编写了 item-based和 user-based 两种协同过虑算法。原创 2015-07-15 11:31:21 · 12276 阅读 · 4 评论