接上一篇文章,如何在合并相同列的csv文件的情况下,保留未匹配到的数据行?
import pandas as pd
import os
df01 = pd.read_csv("C:\\Users\\hanhan\\PycharmProjects\\pythonProject\\01.csv",encoding = 'gb2312',dtype='str')
df02 = pd.read_csv("C:\\Users\\hanhan\\PycharmProjects\\pythonProject\\02.csv",encoding = 'gb2312',dtype='str')
df_pri = pd.merge(df01,df02,on='date',how='outer')
df_pri.to_csv('0102.csv',header=True,index=False)
重点在how='outer'。
意思是取全连接。
例如:
表1:
| date | a | b |
| 2021-11-09 | 1 | 4 |
| 2021-11-10 | 2 | 5 |
| 2021-11-11 | 3 | 6 |
表2:
| date | a |
| 2021-11-09 | 1 |
| 2021-11-10 | 2 |
| 2021-11-11 | 3 |
| 2021-11-12 | 7 |
运行程序得到的结果:
| date | a | b |
| 2021-11-09 | 1 | 4 |
| 2021-11-10 | 2 | 5 |
| 2021-11-11 | 3 | 6 |
| 2021-11-12 | 7 | NaN |
该博客介绍了如何使用Python的pandas库进行CSV文件合并,特别是在合并时如何通过outer连接方式保留所有数据行,即使某些行在另一份文件中不存在。示例展示了将两个包含不同日期数据的CSV文件合并,并在结果中保留了所有日期,包括未匹配的行。
2151

被折叠的 条评论
为什么被折叠?



