Python比较两个csv文件的差异

Python比较两个csv文件的差异

一、背景

  很多时候,为了方便维护版本信息,我们更愿意使用CSV而不是xlsx文件,因为CSV文件支持更多的打开方式,尤其在仓库上维护的话更加方便。在某些场景下我们需要对于两个CSV文件进行一些对比,对于一些简单少量的数据对比,我们可能可以直接使用人工对比,当我们有很多数据的时候,人工对比就不是一个很好的方式了,那这个时候就需要我们使用到一些简单的小脚本工具来帮助我们完成这个工作,此文章旨在于提供一个比较自动化的脚本来比较两个不同的csv文件,下面就是一些介绍和源码。

二、步骤和思路
  1. 读取两个不同的文件。
  2. 通过pandas库的一些方法比较文件内容。
  3. 打印出文件的差异,比如增加内容和删除内容。
三、Pandas的一些方法介绍
  • apply方法
    1. applypandas DataFrame 的一个方法,用于对 DataFrame 的每一行或每一列应用一个函数。axis=1 表示对每一行应用函数。
    2. df.apply(tuple, 1)这段代码的意思是将 df 的每一行转换为一个元组。结果是一个包含每一行元组的 pandas.Series
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

_长风_

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值