- 博客(2)
- 资源 (2)
- 收藏
- 关注
原创 Mahout-kmeans命令行文本文件聚类
准备工作:将文本文件夹上传到HDFS目录:/huanglei/wenben ;文件有以下:(目录和文件内容自己随便定义)具体步骤: Mahout处理文件格式必须是sequencefile,而聚类需要vector类型所以需要提前将文本文件转换,kmeans命令输入需要输入簇目录,所以要canopy生成输入簇(加 –k命令后应该不需要输入簇目录,但我这里提示必须输
2015-10-24 15:45:41
709
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人