1.概述
在机器学习方法中,无论是有监督学习还是无监督学习都使用各种度量来得到不同样本数据的差异度或者不同样本数据对应概率分布之间的相似度。良好的度量可以显著提高算法的分类或预测的准确率。本文基于距离、相似度以及相关系数,研究数据点之间及数据对应的概率分布之间的距离。
2.点距离度量
给定样本空间,
是
维实数空间中数据点的集合,其中
,
,
在机器学习方法中,无论是有监督学习还是无监督学习都使用各种度量来得到不同样本数据的差异度或者不同样本数据对应概率分布之间的相似度。良好的度量可以显著提高算法的分类或预测的准确率。本文基于距离、相似度以及相关系数,研究数据点之间及数据对应的概率分布之间的距离。
给定样本空间,
是
维实数空间中数据点的集合,其中
,
,