
相似度在工作中的使用可以说是相当频繁,今天就带大家介绍pytorch中四种常用的向量相似度评估思路:
- CosineSimilarity
- DotProductSimilarity
- BiLinearSimilarity
- MultiHeadedSimilarity
1 余弦相似度
余弦相似度相信大家都很熟悉了。用两个向量夹角的余弦值作为衡量两个个体间差异的大小。余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似。
import torch
import torch.nn as nn
import math
class CosineSimilarity(nn.Module):
def forward(self, tensor_1, tensor_2):
normalized_tensor_1 = tensor_1 / tensor_1.norm(dim=-1, keepdim=True)
normalized_tensor_2 = tensor_2 / tensor_2.norm(dim=-1, keepdim=True)
return (normalized_tensor_1 * normalized_tensor_2).sum(dim=-1)
2 DotProductSimilarity
这个相似度函数计算每对向量之间的点积,并用可选的缩放来减少输出的方差,以调整结果的输出。
class DotProductSimilarity(nn.Module):
def __init__(self, scale_output=False):
super(DotProductSimilarity, self).__init__()
self.scale_output = scale_output
def forward(self, tensor_1, tensor_2):
result = (tensor_1 * tensor_2)

本文介绍了PyTorch中用于向量相似度评估的四种方法:余弦相似度、点积相似度、双线性相似度和多头相似度。余弦相似度基于向量夹角的余弦值;点积相似度计算点积并可调整输出方差;双线性相似度引入了权重矩阵和偏差;多头相似度则借鉴了Transformer的多头注意力机制。这些方法为复杂场景下的向量相似度计算提供了更多选择。
最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



