利用Python字典将单词映射到属性
1. 词性索引工具实践
首先可以打开词性索引工具 nltk.app.concordance() ,并加载完整的布朗语料库(简化标签集)。接着挑选之前代码示例末尾列出的一些单词,查看单词的标签与上下文的关联。
操作步骤如下:
1. 打开 nltk.app.concordance() 工具。
2. 加载完整的布朗语料库(简化标签集)。
3. 选择单词进行搜索,例如:
- 搜索 near 查看所有形式混合的情况。
- 搜索 near/ADJ 查看其作为形容词的用法。
- 搜索 near N 查看后面接名词的情况。
2. 列表索引与字典索引的对比
在Python中,文本通常被视为单词列表。列表的一个重要特性是可以通过索引“查找”特定项,例如 text1[100] ,指定一个数字就可以返回一个单词,可将列表看作一种简单的表格。
而频率分布则不同,当指定一个单词时会返回一个数字,例如 fdist['monstrous'] 能告诉我们该单词在文本中出现的次数。这种使用单词进行查找的方式就像使用传统字典一样。
以下是一些语言对象及其映射关系的表格:
| 语言对象 | 从…映射 | 映射到… |
| — | — | — |
| 文档索引 | 单词 | 单词所在的页面列表 |
| 同义词词典 | 词义 |
超级会员免费看
订阅专栏 解锁全文
1044

被折叠的 条评论
为什么被折叠?



