
数据挖掘
艾特猫了个咪
github.com/boykait/blog
展开
-
java实现k-means算法
k-means算法作为经典的数据挖掘聚类算法,应用也相当广泛,由用户自己设置一个聚类个数,任取原始的k个数据,将其值作为聚类中心,再将原始数据的其他值按照相应的距离(如 欧氏距离)的大小进行归类,因为选取的k个中心点一般情况下并非为最终的中心点,算法需要多次的递归确定最终的中心点,结束递归的条件就是,本次递归每个簇所产生的新的每个中心点值和该簇上一次产生的中心点值相等,结果稳定,聚类完成。原创 2014-08-16 19:41:54 · 917 阅读 · 3 评论 -
AP算法java实现
AP 聚类, java原创 2015-07-14 16:41:21 · 845 阅读 · 0 评论 -
java实现Apriori算法
package com.test;import java.util.Map;import java.util.HashMap;import java.util.Set;import java.util.HashSet;import java.util.List;import java.util.LinkedList;import java.io.BufferedRead原创 2014-08-24 18:36:30 · 847 阅读 · 0 评论 -
数据挖掘面试题
原文地址:数据挖掘一些面试题总结(Data Mining)【转】作者:幽兰静Data-Mining试题2011Alibaba数据分析师(实习)试题解析一、异常值是指什么?请列举1种识别连续型变量异常值的方法?异常值(Outlier) 是指样本中的个别值,其数值明显偏离所属样本的其余观测值。在数理统计里一般是指一组观测值中与平均值的偏差超过两倍标准差的测定值。转载 2015-09-01 22:49:34 · 35031 阅读 · 0 评论 -
hadoop2.6.0 完全分布式安装
hadoop2.6.0在CentOS6.5上完全分布式安装原创 2015-09-17 18:35:18 · 900 阅读 · 0 评论