1.PorterStemming算法(词干抽取)
http://tartarus.org/~martin/PorterStemmer/
里面有各个版本的词干抽取算法的实现。
2.Lawrence Philips' Metaphone Algorithm
http://aspell.net/metaphone/
里面有各个版本此算法的实现!
附一篇简要介绍此算法相关背景的文章
An Introduction to Double Metaphone and the principles behind Soundex
链接:http://www.datamanagementgroup.com/Resources/Articles/Article_0905_3.asp
3.Levenshtein distance(Edit distance algorithm)
http://www.nist.gov/dads/HTML/Levenshtein.html
4。A*算法的一份C语言实现品
http://bbs.tju.edu.cn/TJUBBSBZUVFYJSTVEFRHJRDYXJBSUMBSMEGVYVZ_E/
http://tartarus.org/~martin/PorterStemmer/
里面有各个版本的词干抽取算法的实现。
2.Lawrence Philips' Metaphone Algorithm
http://aspell.net/metaphone/
里面有各个版本此算法的实现!
附一篇简要介绍此算法相关背景的文章
An Introduction to Double Metaphone and the principles behind Soundex
链接:http://www.datamanagementgroup.com/Resources/Articles/Article_0905_3.asp
3.Levenshtein distance(Edit distance algorithm)
http://www.nist.gov/dads/HTML/Levenshtein.html
4。A*算法的一份C语言实现品
http://bbs.tju.edu.cn/TJUBBSBZUVFYJSTVEFRHJRDYXJBSUMBSMEGVYVZ_E/
文本处理算法精选
本文介绍了几种重要的文本处理算法,包括PorterStemming算法(词干抽取)、LawrencePhilips'MetaphoneAlgorithm(用于声音相似性的匹配算法)、Levenshtein距离(编辑距离算法)及A*算法的一种C语言实现。这些算法对于自然语言处理和信息检索等领域有着广泛的应用。

被折叠的 条评论
为什么被折叠?



