词语相似度计算：2、使用NLTK和WordNet计算词语相似度

NLTK与WordNet实现词语相似度计算

最新推荐文章于 2025-10-05 13:21:33 发布

原创

最新推荐文章于 2025-10-05 13:21:33 发布 · 1.1w 阅读

12 ·

CC 4.0 BY-SA版权

文章标签：

#词语相似度计算 #使用NLTK #WordNet #计算词语相似度

本文介绍了如何利用NLTK库和WordNet在Python中计算词语的相似度，详细步骤见链接，代码简单易懂，可供学习参考。

代码写得比较水。。。。仅供大家参考：

#!usr/bin/env python
# -*- coding:utf-8 -*-


from nltk.corpus import wordnet as wn

import pandas as pd
import numpy as np
from scipy import stats

from sklearn.preprocessing import MinMaxScaler, Imputer




data=pd.read_csv("combined.csv")
wordsList=np.array(data.iloc[:,[0,1]])
simScore=np.array(data.iloc[:,[2]])

predScoreList=np.zeros( (len(simScore),1) )
for i, (word1, word2) in enumerate(wordsList):
    print "process #%d words pair [%s,%s]" % (i, word1, word2)
    count=0
    synsets1=wn.synsets(word1)
    synsets2=wn.synsets(word2)
    for synset1 in synsets1:
        for synset2 in synsets2:
            score=synset1.path_similarity(synset2)