python 保存csv,多列

原创已于 2022-05-06 19:21:19 修改 · 2.7k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#python #开发语言 #数据挖掘

于 2022-05-06 19:17:15 首次发布

【Python】专栏收录该内容

59 篇文章

订阅专栏

该博客介绍了如何使用Python将多个CSV文件读取并合并到一个文件中。首先遍历指定目录获取CSV文件路径，然后读取文件内容并存储为二维列表。在处理过程中，确保所有列表长度一致，通过插入空值来填充。接着将二维列表转秩，并写入新的CSV文件。代码中使用了`pandas`、`numpy`和`os`等库进行操作。

需求：将多个csv文件读取出来，将数据合并到一个csv文件，
1、遍历文件夹，将scv文件存入到列表list1
2、遍历列表list1读取csv文件，将读到的数据存入到二维列表list2
3、开始处理二维列表：
3.1、因为二维列表里的各个列表长度不一致，首先通过插入空值的方法处理成长度一致的列表
3.2、将列表list2转秩，如果不转秩，将会出现行列交换的现象
3.3、写入到新的csv文件

# coding=utf-8
import pandas as pd
import MySQLdb   
import csv
import random
import pymysql
import pandas as pd
import MySQLdb as mdb
import sys
import time
import os
import numpy as np
import time
import gzip
import datetime

#保存成二维csv
def savecsvfromlisttwo(p_list, p_name):
      m_len =0
      #找到最大长度
      for i in range(len(p_list)):
            tep_len = len(p_list[i])
            if tep_len>m_len:
                  m_len = tep_len
      #把小于最大长度的列表补空值，否则下面转秩的时候会按照最短的来转，会丢失数据
      for i in range(len(p_list)):
            t_len = len(p_list[i])
            for j in range(m_len):
                  if j>t_len:
                        p_list[i].append("")

      #转秩
      L =list(map(list,zip(*p_list)))

      #写入csv  encoding='utf-8-sig'  防止中文乱码
      with open(p_name, 'w', encoding='utf-8-sig', newline='\n') as file_handler:
            file_writer = csv.writer(file_handler)            
            # print(m_list[0])
            file_writer.writerows(L)



def fun1(p_list):
      m_list = []
      for i in range(len(p_list)):
            m_dir  = os.path.dirname(p_list[i]) #输出为 'C:/Users/Desktop/lesson/python'
            m_file = os.path.basename(p_list[i]) #输出为 class1.py

            print("m_dir = ",m_dir)
            print("m_file = ",m_file)

            file_name = os.path.basename(m_file)
            file_name = file_name.split('.')[0]
            print(file_name)

            data1 = np.loadtxt(p_list[i],delimiter=',')
            data1 = data1.tolist()
            print("data1 len = ",len(data1))

            data1.insert(0,file_name)
            #将各个csv文件数据放到二维列表
            m_list.append(data1)
            print(type(data1) , type(m_list))
      savecsvfromlisttwo(m_list , r"D:\3333.csv")


def walkFile_list(file):
    p_list = []
    m_count=0
    for root, dirs, files in os.walk(file):
        for f in files:
            m = os.path.join(root, f)
            ss=os.path.splitext(m)
            a = os.path.basename(m)
            if (".csv" == ss[1]):
                  #获取到所有的csv文件
                  p_list.append(m)
            else:
                pass
    return p_list


def main():
      dir = r"E:\Data"
      m_list = walkFile_list(dir)
      fun1(m_list)

if __name__ =="__main__":
      print("start")
      main()