Python文本处理与词汇资源探索
1. 模块(Modules)
在日常的文本处理编程中,我们常常会创建各种各样实用的小函数。随着时间推移,可能会遇到需要将这些函数从旧程序复制到新程序的情况。但此时,我们可能会困惑于哪个文件包含了想要使用的函数的最新版本。为了解决这个问题,我们可以将这些函数集中存放在一个文件中,这样就能轻松访问之前定义的函数,而无需复制。
具体操作如下:将函数保存到一个名为(例如) textproc.py 的文件中。之后,只需从该文件导入函数即可使用,示例代码如下:
>>> from textproc import plural
>>> plural('wish')
wishes
>>> plural('fan')
fen
不过,这里的 plural 函数显然存在错误,因为“fan”的复数形式应该是“fans”。我们无需重新编写函数,只需编辑现有的函数即可。这样,在任何阶段,我们的 plural 函数都只有一个版本,也就不会混淆使用的是哪个版本了。
在Python中,一个文件里的变量和函数定义集合被称为模块(Module),相关模块的集合则称为包(Package)。例如,用于处理布朗语料库的代码就是一个模块,而处理各种不同语料库的代码集合则是一个包。
注意事项 :如果要创建一个包含Python代码的文件,请勿将其命名为 nltk.p
超级会员免费看
订阅专栏 解锁全文
2365

被折叠的 条评论
为什么被折叠?



