torch.nn.functional.cosine_similarity使用详解

JasonLiu1919

已于 2022-11-03 14:45:27 修改

阅读量2.5w

点赞数 26

CC 4.0 BY-SA版权

分类专栏： PyTorch 文章标签： pytorch 深度学习

于 2021-10-07 23:44:41 首次发布

本文链接：https://blog.youkuaiyun.com/ljp1919/article/details/120643732

PyTorch 专栏收录该内容

7 篇文章

订阅专栏

本文解析了如何在PyTorch中使用`F.cosine_similarity`函数计算矩阵间的余弦相似度，特别关注了dim参数的选择及其对结果的影响，通过实例演示了dim=0和dim=1的不同效果，并用Scipy库进行了验证。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

更多、更及时内容欢迎留意微信公众号： 小窗幽记机器学习

概述

根据官网文档的描述，其中 dim表示沿着对应的维度计算余弦相似。那么怎么理解呢？
首先，先介绍下所谓的dim:

a = torch.tensor([[ [1, 2], [3, 4] ], [ [5, 6], [7, 8] ] ], dtype=torch.float)
print(a.shape)
"""
[
    [
        [1, 2],
        [3, 4]
    ],
    [
        [5, 6],
        [7, 8]
    ]
]
"""

在这里插入图片描述

假设有2个矩阵：[[1, 2], [3, 4]] 和 [[5, 6], [7, 8]], 求2者的余弦相似。

按照dim=0求余弦相似：

import torch.nn.functional as F
input1 = torch.tensor([[1, 2], [3, 4]], dtype=torch.float)
input2 = torch.tensor([[5, 6], [7, 8]], dtype=torch.float)
output = F.cosine_similarity(input1, input2, dim=0)
print(output)

结果如下：

tensor([0.9558, 0.9839])

那么，这个数值是怎么得来的？是按照

在这里插入图片描述

具体求解如下：

print(F.cosine_similarity(torch.tensor([1,3], dtype=torch.float) , torch.tensor([5,7], dtype=torch.float), dim=0))
print(F.cosine_similarity(torch.tensor([2,4], dtype=torch.float) , torch.tensor([6,8], dtype=torch.float), dim=0))

运行结果如下:

tensor(0.9558)
tensor(0.9839)

可以用scipy.spatial进一步佐证:

from scipy import spatial

dataSetI = [1,3]
dataSetII = [5,7]
result = 1 - spatial.distance.cosine(dataSetI, dataSetII)
print(result)

运行结果如下:

0.95577900872195

同理：

dataSetI = [2,4]
dataSetII = [6,8]
result = 1 - spatial.distance.cosine(dataSetI, dataSetII)
print(result)

运行结果如下:

0.9838699100999074

按照dim=1求余弦相似:

output = F.cosine_similarity(input1, input2, dim=1)
print(output)

运行结果如下：

tensor([0.9734, 0.9972])

同理，用用scipy.spatial进一步佐证:

dataSetI = [1,2]
dataSetII = [5,6]
result = 1 - spatial.distance.cosine(dataSetI, dataSetII)
print(result)

运行结果：0.973417168333576

dataSetI = [3,4]
dataSetII = [7,8]
result = 1 - spatial.distance.cosine(dataSetI, dataSetII)
print(result)

运行结果：

0.9971641204866132

结果与F.cosine_similarity相符合。

【更多、更及时内容欢迎留意微信公众号： 小窗幽记机器学习 】