python基于pandas使两个表格之间匹配某一属性

import pandas as pd
import numpy as np
#编码距离,用于匹配最相近的中文字符串
def edit_distance(word1, word2):
    len1 = len(word1)
    len2 = len(word2)
    dp = np.zeros((len1 + 1, len2 + 1))
    for i in range(len1 + 1):
        dp[i][0] = i
    for j in range(len2 + 1):
        dp[0][j] = j

    for i in range(1, len1 + 1):
        for j in range(1, len2 + 1):
            delta = 0 if word1[i - 1] == word2[j - 1] else 1
            dp[i][j] = min(dp[i - 1][j - 1] + delta, min(dp[i - 1][j] + 1, dp[i][j - 1] + 1))
    return dp[len1][len2]


a=pd.read_csv(r'表格路径')
b=pd.read_excel(r'表格路径')
A=a['属性3'].tolist()
print(A)

Azl=a['属性1']
Arj=a['属性2']
B=b['属性3'].tolist()
count=0
for i in A:
    list1=[]
    dic1={}
    for j in B:
        distance=edit_distance(i,j)
        if distance==0:
            dic1
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值