
Mahout
早上的阳光
拥有多年软件开发经验,两个国家级管理证书,一个国际管理认证证书,一直奋斗在一线的IT民工。
展开
-
Hello World聚类代码(一)
使用Mahout 聚类 如下package org.test.mymahout.chapter07;import java.io.File;import java.io.IOException;import java.util.ArrayList;import java.util.List;import org.apache.hadoop.conf.Configur原创 2016-03-04 10:58:39 · 846 阅读 · 0 评论 -
Hello World聚类代码(二)
Hello World聚类代码(一) 执行后出现异常 hadoop 启动时 TaskTracker无法启动ERROR org.apache.hadoop.mapred.TaskTracker: Can not start task tracker because java.io.IOException: Failed to set permissions of path:原创 2016-03-04 11:31:26 · 750 阅读 · 1 评论 -
mahout 中聚类算法kmeans案例
最近在学习Hadoop 之家Mahout ,看了一些博客觉得挺不错的,记录下来以备学习也和大家分享.1. 聚类算法kmeans聚类分析是数据挖掘及机器学习领域内的重点问题之一,在数据挖掘、模式识别、决策支持、机器学习及图像分割等领域有广泛的应用,是最重要的数据分析方法之一。聚类是在给定的数据集合中寻找同类的数据子集合,每一个子集合形成一个类簇,同类簇中的数据具有更大的相似性。聚类算转载 2016-02-24 10:33:03 · 2259 阅读 · 0 评论 -
mahout 计算方差标准差
标准差(Standard Deviation),在概率统计中最常使用作为统计分布程度(statistical dispersion)上的测量。标准差定义是总体各单位标准值与其平均数离差平方的算术平均数的平方根。它反映组内个体间的离散程度。测量到分布程度的结果,原则上具有两种性质:为非负数值, 与测量资料具有相同单位。一个总量的标准差或一个随机变量的标准差,及一个子集合样品数的标准差之间原创 2016-07-14 14:31:05 · 1470 阅读 · 0 评论 -
推荐算法-皮尔逊相关系数的相似度
探索相似性度量 基于用的推荐程序的一个重要的部分是用户相似度(UserSimilarity)实现。基于用户的推荐非常依赖这个组件。如果对用户的相似性缺乏可靠有效的定义,这类推荐方法是没有意义的。这也适用于用户的推荐的“近亲”------基于物品的推荐程序,它同样依赖相似性。基于皮尔逊相关系数的相似度皮尔逊相关系数是一个介于-1和1之间的数,它度量 两个一一对应数列之间的线性相关程度。...原创 2019-03-31 12:44:43 · 9605 阅读 · 0 评论