Python中使用字典将单词映射到属性
1. 词性索引工具实践
首先,可以打开POS索引工具 nltk.app.concordance() ,并加载完整的布朗语料库(简化标签集)。接着选择之前代码示例末尾列出的一些单词,查看单词的标签与上下文的关联。例如:
- 搜索 near ,查看所有形式混合在一起的情况。
- 搜索 near/ADJ ,查看它作为形容词的用法。
- 搜索 near N ,查看仅在名词跟随的情况。
代码示例:
# 这里假设已经导入了nltk并下载了布朗语料库
import nltk
nltk.download('brown')
nltk.app.concordance() # 打开POS索引工具
# 加载布朗语料库
brown_corpus = nltk.corpus.brown
tagged_words = brown_corpus.tagged_words()
2. 列表索引与字典索引对比
在Python中,文本通常被视为单词列表。列表的一个重要特性是可以通过索引“查找”特定项,例如 text1[100] ,指定一个数字并返回一个单词。可以将列表看作一种简单的表格。
而频率分布则不同,指定一个单词会返回一个数字,例如 fdist['monstrous'] ,它告诉我们给定单词在文本中出现的次数。这种使用单词进
超级会员免费看
订阅专栏 解锁全文
3722

被折叠的 条评论
为什么被折叠?



