划分数据原则:将无序的数据变得更加有序。
划分数据的一种方法:使用信息论量化度量信息的内容
集合信息的度量方式成为香农熵或者简称为熵。而熵定义为信息的期望值。
计算熵,即求取所有类别所有可能值包含的信息期望值: (熵计算公式如下)
H = - ∑Ni=1p(xi)log2p(xi)∑i=1Np(xi)log2p(xi)
集合信息的度量方式成为香农熵或者简称为熵。而熵定义为信息的期望值。
计算熵,即求取所有类别所有可能值包含的信息期望值: (熵计算公式如下)
H = - ∑Ni=1p(xi)log2p(xi)∑i=1Np(xi)log2p(xi)