
Hadoop
文章平均质量分 73
lznnnnnnn
这个作者很懒,什么都没留下…
展开
-
win10+Ubuntu双系统 Easybcd安装
安装win10+Ubuntu双系统我们用到的工具有: 【1】Ubuntu的镜像文件 【2】Easybcd 安装过程如下: 【1】打开刚刚下载的easybcd软件,依次点击“添加新条目”,“NeoGrub”,“安装”后,会激活“配置”按钮,这时点击“配置”,会出现一个名为“menu.lst”的txt文件。 这时,我们需要重新编辑这个txt文件,将如下内容复制进去,替换掉全原创 2015-12-23 15:54:59 · 18876 阅读 · 4 评论 -
Mahout(一):数据承载
推荐数据的处理是大规模的,在集群环境下一次要处理的数据可能是数GB,所以Mahout针对推荐数据进行了优化。 Preference 在Mahout中,用户的喜好被抽象为一个Preference,包含了userId,itemId和偏好值(user对item的偏好)。Preference是一个接口,它有一个通用的实现是GenericPreference。 Pr转载 2016-01-28 11:23:28 · 431 阅读 · 0 评论 -
Mahout(二):相似性度量
User CF 和 Item CF 都依赖于相似度的计算,因为只有通过衡量用户之间或物品之间的相似度,才能找到用户的“邻居”,才能完成推荐。上文简单的介绍了相似度的计算,但不完全,下面就对常用的相似度计算方法进行详细的介绍: 1. 基于皮尔森相关性的相似度 —— Pearson correlation-based similarity 皮尔森相关系数反应了两个变量之间的线性相关程度,它的取转载 2016-01-28 11:20:09 · 741 阅读 · 0 评论