Python数据处理实践1,excel不同表单字段对比,标识匹配项

本文介绍了一种使用Python pandas库进行Excel表单数据比对的方法。通过读取两个不同的表单,将表单2中B列的字段与表单1的A列进行比对,如果找到匹配项,则在表单1的对应行D列上标识为1。此过程涉及数据读取、字段比对及结果标识,适合于需要快速比对大量数据的场景。
'''
比对表单1和表单2,若表单1 A列含有表单2 B列的字段,则标识表单1对应行
'''
import pandas as pd
import numpy as np
import datetime

if __name__=='__main__':

    starttime=datetime.datetime.now()
    sheet1=pd.read_excel('URL.xlsx',sheet_name='表单1') #读取表单1
    sheet2=pd.read_excel('URL.xlsx',sheet_name='表单2')  #读取表单2

    d1=sheet2.iloc[:,B] #表单2需匹配到表单1的字段列
    d2=np.unique(d1) #去重
    table_row2=d2.shape[0] #表单2需匹配到表单1的字段,distinct个数,递归第二层数量
    table_row1=sheet1.shape[0] #表单1的个数,递归第一层数量

    for j in range(1,table_row1):
        for i in range(0,table_row2-1):
           if sheet1.iloc[j,A]==d2[i]: #判断A列是否包含表2 B列的字段
                sheet1.iloc[j,D]=1 #若匹配到,改行D列数据为1,用于标识
                break



sheet1.to_excel('URL.xlsx')

endtime=datetime.datetime.now()
print(endtime-starttime)
print("Done")

 

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值