词语相似度计算:1、安装NLTK和下载WordNet语料库;WordNet的使用

本文介绍了如何在Python中安装NLTK库并下载WordNet语料库,详细阐述了如何利用WordNet查找单词的同义词集,并探讨了词语之间的相似度计算方法,包括基于路径相似度的评分策略。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >



NLTK在anaconda中有,WordNet语料库需要手动下载。这里主要介绍如何下载wordnet语料库。。。


In [1]: from nltk.corpus import wordnet as wn

In [2]: wn.syssets('love')
Traceback (most recent call last):

  File "<ipython-input-2-dda9a665adaa>", line 1, in <module>
    wn.syssets('love')

  File "d:\Anaconda\lib\site-packages\nltk\corpus\util.py", line 99, in __getattr__
    self.__load()

  File "d:\Anaconda\lib\site-packages\nltk\corpus\util.py", line 64, in __load
    except LookupError: raise e

LookupError: 
**********************************************************************
  Resource u'corpora/wordnet' not found.  Please use the NLTK
  Downloader to obtain the resource:  >>> nltk.download()
  Searched in:
    - 'C:\\Users\\mmc/nltk_data'
    - 'C:\\nltk_data'
    - 'D:\\nltk_data'
    - 'E:\\nltk_data'
    - 'd:\\Anaconda\\nltk_data'
    - 'd:\\Anaconda\\lib\\nltk_data'
    - 'C:\\Users\\mmc\\AppData\\Roaming\\nltk_data'
**********************************************************************



解决方法:

In [3]: import nltk

In [4]: nltk.download()
出现下面的图形界面:

注意,选择第二个选项卡“Corpora”,滑到下面选择和wordnet相关的两个语料库,否则你就等着他慢慢下载吧。。。。。





参考文章,感谢他们:

NLTK:http://www.nltk.org/

WordNet:http://wordnet.princeton.edu/


http://www.velvetcache.org/2010/03/01/looking-up-words-in-a

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值