算法
lkf0217
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Levenshtein Distance(LD)-计算两字符串相似度算法
两字符串相似度计算方法有好多,现对基于编距的算法的相似度计算自己总结下。 简单介绍下Levenshtein Distance(LD):LD 可能衡量两字符串的相似性。它们的距离就是一个字符串转换成那一个字符串过程中的添加、删除、修改数值。 举例:如果str1="test",str2="test",那么LD(str1,str2) = 0。没有经过转换。转载 2009-08-20 16:39:00 · 3896 阅读 · 0 评论 -
字符串相似度算法介绍(整理)
最近在做这方面的应用,把我找到的资料贴出来,有需要的人可以参考参考。1.编辑距离(Levenshtein Distance)编辑距离就是用来计算从原串(s)转换到目标串(t)所需要的最少的插入,删除和替换的数目,在NLP中应用比较广泛,如一些评测方法中就用到了(wer,mWer等),同时也常用来计算你对原文本所作的改动数。编辑距离的算法是首先由俄国科学家Levenshtein提出的,故转载 2009-08-20 16:38:00 · 1708 阅读 · 0 评论
分享