
数据挖掘
文章平均质量分 89
六月心悸
一个好二好二的男孩子
展开
-
Mahout--(二)协同过滤推荐
协同过滤 —— Collaborative Filtering协同过滤简单来说就是根据目标用户的行为特征,为他发现一个兴趣相投、拥有共同经验的群体,然后根据群体的喜好来为目标用户过滤可能感兴趣的内容。协同过滤推荐 —— Collaborative Filtering Recommend协同过滤推荐是基于一组喜好相同的用户进行推荐。它是基于这样的一种假设:为一用户找到他真正感兴趣的内转载 2015-07-16 14:43:01 · 674 阅读 · 0 评论 -
Mahout--用Maven构建Mahout项目(mahoutDemo)
原博地址:http://blog.fens.me/hadoop-mahout-maven-eclipse/前言基于Hadoop的项目,不管是MapReduce开发,还是Mahout的开发都是在一个复杂的编程环境中开发。Java的环境问题,是困扰着每个程序员的噩梦。Java程序员,不仅要会写Java程序,还要会调linux,会配hadoop,启动hadoop,还要会自己运维。所以,新转载 2015-07-16 14:10:42 · 1226 阅读 · 0 评论 -
Mahout--(五)mahout疑问解答
来源:http://www.douban.com/note/245740667/ 提问1:博涛前辈,您好!打扰您了,我想请教您一些问题。我是一名在读研一学生,研究推荐系统方面的知识。 我一直很困惑,在实际应用中,给定一个应用系统,例如淘宝,或者给定一个应用系统积累的数据集,如何用推荐系统的思想着手分析,如何为系统设计一个好的推荐方法,又是怎样一个流程去分析这类问题?我看了mahou原创 2015-07-16 16:39:02 · 1114 阅读 · 0 评论 -
Mahout--用通俗易懂的大白话讲解Map/Reduce原理
Hadoop简介原博:http://blog.youkuaiyun.com/lifuxiangcaohui/article/details/22675437Hadoop就是一个实现了Google云计算系统的开源系统,包括并行计算模型Map/Reduce,分布式文件系统HDFS,以及分布式数据库Hbase,同时Hadoop的相关项目也很丰富,包括ZooKeeper,Pig,Chukwa,Hive,H转载 2015-07-15 09:45:00 · 1172 阅读 · 0 评论 -
Mahout--(四)Taste的架构和部署Demo
Taste简介Taste是Apache Mahout提供的一个协同过滤算法的高效实现,它是一个基于Java实现的可扩展的,高效的推荐引擎。Taste既实现了最基本的基于用户的和基于内容的推荐算法,同时也提供了扩展接口,使用户可以方便的定义和实现自己的推荐算法。同时,Taste不仅仅只适用于Java应用程序,它可以作为内部服务器的一个组件以HTTP和Web Service的形式向外界提供推荐转载 2015-07-16 15:36:56 · 1137 阅读 · 0 评论 -
Mahout--(三)相似性度量
User CF 和 Item CF 都依赖于相似度的计算,因为只有通过衡量用户之间或物品之间的相似度,才能找到用户的“邻居”,才能完成推荐。上文简单的介绍了相似度的计算,但不完全,下面就对常用的相似度计算方法进行详细的介绍:1. 基于皮尔森相关性的相似度 —— Pearson correlation-based similarity皮尔森相关系数反应了两个变量之间的线性相关程度,它的取转载 2015-07-16 15:09:58 · 650 阅读 · 0 评论 -
Mahout--简单推荐系统Demo
mahout简单推荐系统工具:mahout 0.8Myeclipse10maven3.2.5代码: import java.io.BufferedReader;import java.io.BufferedWriter;import java.io.File;import java.io.FileReader;import java.io.FileWriter;原创 2015-07-17 11:27:05 · 2860 阅读 · 0 评论 -
Mahout--(一)数据承载
推荐数据的处理是大规模的,在集群环境下一次要处理的数据可能是数GB,所以Mahout针对推荐数据进行了优化。Preference在Mahout中,用户的喜好被抽象为一个Preference,包含了userId,itemId和偏好值(user对item的偏好)。Preference是一个接口,它有一个通用的实现是GenericPreference。Pr原创 2015-07-16 14:03:28 · 919 阅读 · 0 评论