Pandas:对两个dataframe文件按照某列去重
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
文章目录场景描述1.代码2.运行结果
场景描述
最近处理大的日志文件遇到同一个block_id既出现在正常日志文件中,又出现在异常日志文件中的情况。因此需要剔除这个blk_id所对应的日志信息。
虽然按照传统的匹配方法就能解决这一问题,但是需要运行很长的时间。考虑到时间成本,我打算使用现有的pan
原创
2020-10-10 17:40:13 ·
3103 阅读 ·
0 评论