使用 awk 实现简单的拼写检查器
1. 字典的获取与处理
在进行拼写检查时,字典的选择至关重要。如果 Dictionaries 为空,程序会先查看环境数组 ENVIRON ,使用其中设置的值。若 Dictionaries 仍然为空,则会使用内置的字典列表。选择这个列表需要谨慎,因为不同的 Unix 平台存在较大差异,而且对于小文件,程序的大部分运行时间都花在加载字典上。
字典名以数组索引的形式存储,而非数组值,这样做有两个好处:一是自动处理重复提供的字典,仅保存一个文件名实例;二是便于使用 for (key in array) 循环遍历字典列表,无需维护字典数量的变量。
以下是获取字典的代码:
function get_dictionaries( files, key)
{
if ((Dictionaries == "") && ("DICTIONARIES" in ENVIRON))
Dictionaries = ENVIRON["DICTIONARIES"]
if (Dictionaries == "") # Use default dictionary list
{
DictionaryFiles["/usr/dict/words"]++
DictionaryFiles["/usr/local/share/dict/words.knuth"]++
}
el
超级会员免费看
订阅专栏 解锁全文
2

被折叠的 条评论
为什么被折叠?



