@本文来源于公众号:csdn2299,喜欢可以关注公众号 程序员学府
这篇文章主要介绍了python代码如何实现余弦相似性计算,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
A:西米喜欢健身
B:超超不爱健身,喜欢打游戏
step1:分词
A:西米/喜欢/健身
B:超超/不/喜欢/健身,喜欢/打/游戏
step2:列出两个句子的并集
西米/喜欢/健身/超超/不/打/游戏
step3:计算词频向量
A:[1,1,1,0,0,0,0]
B:[0,1,1,1,1,1,1]
step4:计算余弦值

余弦值越大,证明夹角越小,两个向量越相似。
step5:python代码实现
import jieba
import jieba.analyse
def words2vec(words1=None, words2=None):
v1 = []
v2

本文介绍了如何使用Python计算余弦相似性,从分词到计算词频向量,再到余弦值的求解,详细阐述了整个过程。同时分享了作者自学Python的经历和对程序员成长的看法。
最低0.47元/天 解锁文章
770

被折叠的 条评论
为什么被折叠?



