WMD距离



余弦相似度
设两个文本的词向量分别为A=[A1,A2,…,An],B=[B1,B2,…,Bn],两个文本的cos相似度计算方式如下:

python代码:
import numpy as np
def similarity_cos(x,y):
product = x.dot(y)
denom = np.linalg.norm(x=x, ord=2) * np.linalg.norm(x=y, ord=2)
return product/denom
A = np.array([1, 1, 1, 1, 0, 1, 0 ,0])
B = np.array([1, 1, 1, 0, 1, 1, 0 ,0])
print(similarity_cos(A,B))
本文介绍了一种衡量文本相似度的方法——Cosine相似度,并提供了使用Python实现的具体代码示例。通过将文本表示为词向量,Cosine相似度能够计算出两篇文本之间的相似程度。
20

被折叠的 条评论
为什么被折叠?



