Python自然语言处理:模块、词汇资源与WordNet详解
1. Python模块与包
在日常的Python编程中,我们常常会创建各种实用的文本处理小函数。随着时间的推移,我们可能会在不同的程序中重复使用这些函数,这就导致我们需要不断地从旧程序复制到新程序。但问题是,我们很难确定哪个文件包含了我们想要使用的函数的最新版本。
为了解决这个问题,我们可以将这些函数保存到一个文件中,例如 textproc.py 。这样,我们就可以通过从该文件导入函数来使用它们,而无需复制函数代码。以下是一个示例:
# 假设textproc.py文件中定义了plural函数
# 从textproc文件中导入plural函数
from textproc import plural
print(plural('wish')) # 输出: wishes
print(plural('fan')) # 输出: fen
这里的 plural 函数可能存在错误,因为 “fan” 的复数形式应该是 “fans”。不过,我们不需要重新编写这个函数,只需要直接编辑 textproc.py 文件中的 plural 函数即可。这样,在任何时候,我们的 plural 函数都只有一个版本,避免了使用时的混淆。
在Python中,一个包含变量和函数定义的文件被称为模块,而一组相关的模块则被称为包。例如,用于处理布朗语料库的代码就是一个模块,而处理所有不同语料库的
超级会员免费看
订阅专栏 解锁全文
4517

被折叠的 条评论
为什么被折叠?



