聚类分析中存在一种方法:‘模糊C均值’,模糊C均值的发现,要感谢模糊数学之父“扎德”老爷子,他老人家当年提出了“模糊集合论”和“模糊逻辑”,介绍算法之前,先简单的补充一些相关的知识点.
所谓模糊集合论,就是一种处理结果不确定、不能精确量化的方法。例如:存在一句话“今天估计会下雨”,这就是典型的模糊,我们不能精确的表示这句话的值,今天估计会下雨,那下雨的程度是多少呢?我们此时就用【0,1】来表示此句话为真的程度,例如,今天50%会下雨,则今天下雨为真的程度就是0.5,0.5叫做“隶属度”,当然,今天不下雨的隶属度为1-0.5=0.5.
所谓模糊C均值算法,是指该算法的聚类(簇)的定义(界限)是模糊的,不同于K均值(K均值中的簇是确定的,以质心为中心,确定的簇),意思就是说:模糊C均值中,每个数据点(元素)到每个簇都存在一个隶属度,但是每个数据点到所有簇的隶属度之和为