
mahout
mrwang
这个作者很懒,什么都没留下…
展开
-
mahout0.7 示例运行纪实
运行太不容易了 所以要记下来以免后面忘记了首先是数据vim testdata.txt第一列为UserID ,第二列为ItemID,第三列为Preference Value 即评分1,101,51,102,31,103,2.52,101,22,102,2.52,103,52,104,23,101,2.53,104,43,105,4.53,107,54,101,54,103,3原创 2014-02-10 15:52:37 · 430 阅读 · 0 评论 -
从源代码剖析Mahout推荐引擎
从源代码剖析Mahout推荐引擎Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, Flume, Bigtop, Crunc转载 2014-02-10 15:54:07 · 650 阅读 · 0 评论 -
mahout 例子
http://www.cnblogs.com/jerome-rong/archive/2012/05/22/2512947.html转载 2014-02-10 15:52:39 · 418 阅读 · 0 评论 -
mahout 安装编译
环境apache-maven-3.0.5-bin.tar hadoop-1.1.2-bin.tar mahout-distribution-0.7-src.tar mahout 需要编译hadoop就不说了 然后环境变量需要设置的这几个 650) this.width=650;" src="http://img1.51cto.com/attachment/201305/16原创 2014-02-10 15:52:34 · 544 阅读 · 0 评论 -
Mahout的taste推荐系统里的几种Recommender分析
Taste简介 看自:http://blog.youkuaiyun.com/zhoubl668/article/details/13297583Mahout 是apache下的一个java语言的开源大数据机器学习项目,与其他机器学习项目不同的是,它的算法多数是mapreduce方式写的,可以在hadoop上运行,并行化处理大规模数据。协同过滤在mahout里是由一个叫taste的引擎提供的, 它提供两种模式,转载 2014-02-10 15:54:09 · 1390 阅读 · 0 评论 -
mahout0.7 使用 JDBCDataModel
首先创建在mysql中创建库以及对应的表mysql> create database mahout;Query OK, 1 row affected (0.00 sec)mysql> use mahout;Database changedmysql> create table intro( -> uid varchar(20) not null, -> iid varc原创 2014-02-10 15:54:00 · 2991 阅读 · 1 评论 -
Mahout数据承载
转自: http://blog.youkuaiyun.com/zhoubl668/article/details/13508417推荐数据的处理是大规模的,在集群环境下一次要处理的数据可能是数GB,所以Mahout针对推荐数据进行了优化。Preference在Mahout中,用户的喜好被抽象为一个Preference,包含了userId,itemId和偏好值(user对item的偏好)。Preference是转载 2014-02-10 15:54:13 · 569 阅读 · 0 评论 -
在windows xp下利用Eclipse构建Mahout
转自:http://www.cnblogs.com/dlts26/archive/2011/09/13/2174889.html1. Mahout构建的先决条件1) JDK,使用1.6版本。需要说明一下,因为要基于Eclipse构建,所以在设置path的值之前要先定义JAVA_HOME变量。2) Maven,使用2.0.11版本或以上。在eclipse上安装maven插件—m2eclipse。2.转载 2014-02-10 15:53:58 · 472 阅读 · 0 评论 -
mahout所实现的算法
https://cwiki.apache.org/confluence/display/MAHOUT/Algorithms 列出mahout所实现或正在实现的一些算法ClassificationLogistic Regression (SGD)BayesianSupport Vector Machines (SVM) (open: MAHOUT-14, MAHOUT-232 and MAHOUT-原创 2014-02-10 15:54:15 · 779 阅读 · 0 评论 -
学习推荐系统概况
推荐系统虽然有很多的技术 但是 总的来说可分为两大类 1. 基于内容的推荐(Content-Based System) 这类系统主要考察时推荐的项(Item)的性质。 2. 协同过滤系统(Collaborative-Filtering System) 这类系统通过计算用户与项之间的相似度来推荐项。基于内容的推荐: 实现的步奏 1. Item Representation:为每个i原创 2014-02-10 15:54:05 · 646 阅读 · 0 评论 -
Mahout中相似度计算方法介绍
在现实中广泛使用的推荐系统一般都是基于协同过滤算法的,这类算法通常都需要计算用户与用户或者项目与项目之间的相似度,对于数据量以及数据类型不同的数据源,需要不同的相似度计算方法来提高推荐性能,在mahout提供了大量用于计算相似度的组件,这些组件分别实现了不同的相似度计算方法。下图用于实现相似度计算的组件之间的关系:650) this.width=650;" src="http://img1.51c原创 2014-02-10 15:54:11 · 556 阅读 · 0 评论