聚类分析:k-means算法及评估方法
1. 查看k-means聚类结果
完成k-means聚类后,我们希望查看每个聚类的摘要。Mahout提供了 ClusterDumper 类来实现这一功能。我们需要提供聚类的位置,同时也可以提供字典的位置,这样输出就能返回每个聚类的顶级术语。
以下是相关代码:
(defn run-cluster-dump [in-path dict-path points-dir out-path]
(let [distance-measure
"org.apache.mahout.common.distance.CosineDistanceMeasure"]
(ClusterDumper/main
(->> (vector "-i" in-path
"-o" out-path
"-d" dict-path
"--pointsDir" points-dir
"-dm" distance-measure
"-dt" "sequencefile"
"-b" "100"
"-n" "20"
"-sp" "0"
"--evaluate")
(map str)
(int
超级会员免费看
订阅专栏 解锁全文
10万+

被折叠的 条评论
为什么被折叠?



