基于相似度的学习方法详解
1. 相似度学习简介
相似度学习是基于训练样本之间的成对相似度进行学习的过程。这个过程可以是有监督的,也可以是无监督的。成对关系可以是相似度、相异度或距离函数。相似度函数可能是非对称的,甚至可能不满足度量或内积所需的其他数学性质。
1.1 有监督与无监督学习目标
- 有监督学习 :使用标记训练样本之间的成对相似度,以及测试样本与训练样本集之间的相似度,来估计测试样本的类别标签。
- 无监督学习 :利用样本之间的成对相似度,在未标记的训练样本中寻找隐藏结构。
1.2 相似度学习的优势
相似度学习的一个优点是,只要相似度函数定义明确,并且可以为任意一对样本计算相似度,就不需要直接访问特征。因此,特征空间不需要是欧几里得空间。
1.3 应用领域
相似度学习方法在多个领域得到了广泛应用,包括计算机视觉、自然语言处理、计算生物学和信息检索等。以下是一些具体的应用方法:
|领域|应用方法|
| ---- | ---- |
|计算机视觉|Tangent距离、Earth Mover’s距离、形状匹配距离、金字塔匹配核、PQ核等|
|计算生物学|Hamming距离、编辑距离、Kendall’s tau距离、秩距离、FASTA算法、BLAST算法等|
|信息检索和文本挖掘|词频 - 逆文档频率(TF - IDF)向量的余弦相似度、字符串核|
1.4 相似度学习方法分类
相似
超级会员免费看
订阅专栏 解锁全文
903

被折叠的 条评论
为什么被折叠?



