我在使用concat方法连接一个地址下的多个CSV文件时,发现会引入NAN
# 设置文件夹路径
folder_path = 'D:/feature/buchang/ruc_5min_w_r_nr/ab'
# 读取所有CSV文件并组合在一起
data = pd.DataFrame()
for file_name in os.listdir(folder_path):
if file_name.endswith('.csv'):
file_path = os.path.join(folder_path, file_name)
df = pd.read_csv(file_path)
df = df.dropna()
data = pd.concat([data, df],axis=0)
大概程序是这样,后面检查了很多地方,终于发现原因。
因为我的原始CSV文件中没有列名,会导致concat连接的时候寻找同一列失败,所以会引入很多NAN,可以使用程序为所有CSV文件添加进列名,就可以正常使用代码。
文章讲述了作者在使用pandas的concat方法合并CSV文件时遇到NAN问题,原因是原始文件无列名。通过为所有CSV文件添加列名,解决了数据合并过程中的错误。
645

被折叠的 条评论
为什么被折叠?



