编辑距离:
又称Levenshtein距离(莱文斯坦距离也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数,如果它们的距离越大,说明它们越是不同。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
具体的执行过程参考点击打开链接 这篇博客
import math
def minEditDist(sm,sn):
m,n = len(sm)+1,len(sn)+1
# create a matrix (m*n)
matrix = [[0]*n for i in range(m)]
#初始化矩阵
matrix[0][0]=0
for i in range(1,m):
matrix[i][0] = matrix[i-1][0] + 1
for j in range(1,n):
matrix[0][j] = matrix[0][j-1]+1
for i in range(m):
print (matrix[i])
print ("********************")
cost = 0
for i in range(1,m):
for j in range(1,n):
if sm[i-1]==sn[j-1]:

本文介绍了使用Python3实现编辑距离(Levenshtein距离)来衡量两个二进制序列的相似性。编辑距离是一种通过替换、插入或删除字符将一个字符串转换为另一个字符串所需的最小操作数。通过计算这个距离,可以判断两个序列的相似程度。详细步骤可参考相关博客链接。
最低0.47元/天 解锁文章
3707

被折叠的 条评论
为什么被折叠?



