
机器学习
lookaykwok
这个作者很懒,什么都没留下…
展开
-
信息熵,条件熵,信息增益与信息增益比
1. 信息熵 熵表示随机变量不确定性的度量。设 是一个取有限值的离散随机变量,其概率分布为 那么随机变量 的信息熵为 ...原创 2018-08-04 14:11:29 · 672 阅读 · 0 评论 -
常见的距离计算方式和相似度计算方式
1. 距离计算方式 1.1 欧式距离(直线距离) 和 分别为两个n维向量,距离计算公式为: 当不同维度的量纲不一致时,量纲大的维度权重会变大,解决方式为: 1). 向量归一化 2). 欧式距离标准化。其中为第i个维度的标准差(根据整个数据集计算) 3). 马氏距离 欧式距离: 马氏距离: ...原创 2018-09-13 11:21:16 · 1355 阅读 · 0 评论