
机器学习
致远_Zy
向往大数据的苦逼开发人员
展开
-
Apache Mahout的协同过滤算法分析
Apache Mahout协同过滤中,构建UserSimilarity接口使用到的方法如下:一、基于皮尔逊相关系数算法皮尔逊相关系数是一个介于1和-1之间的数,它度量两个一一对应的数列之间的线性相关程度。也就是说,它表示两个数列中对应数字一起增长或一起减小的可能性。它度量数字一起按比例改变的倾向性,也就是说两个数列中的数字存在一个大致的线性关系。当该倾向性强时,相关值趋于1原创 2017-02-17 16:38:59 · 719 阅读 · 0 评论 -
机器学习整理的一些概念
什么是监管学习:所谓监管学习就是给定一堆样本,每个样本都有一组属性和一个类别,这些类别是事先确定的,那么通过学习得到一个分类器,这个分类器能够对新出现的对象给出正确的分类。这样的机器学习就被称之为监督学习。什么是熵(entropy)是信息不确定性的一个测度,熵越大则表示信息的不确定程度越高举个例子:预测明天的天气,如果能100%确定明天一定是晴天,那么熵就是-1*log原创 2017-02-17 17:24:47 · 422 阅读 · 0 评论