在处理数据的时候经常需要读取TXT文件类型的数据转换为可执行的list,但是当我们有Excel的文件,如何将Excel文件转换为每行固定长度的TXT文件呢!如果数据量很少的情况下,人工处理还好,可是在大数据的情况下就显得不可能了,这时如果我们利用程序执行这一命令就轻松多了,废话不多说,下面介绍代码。
首先在python中import两个必要的包(我们面向的对象是.csv的Excel文件)
import numpy as np
import csv
接下来,就是读取Excel文件,在读取的文件路径上本文采用绝对路径的方式:
with open('F:/Data/DATA/airquality1.csv','rb') as csv_file:
all_lines = csv.reader(csv_file)
for one_line in all_lines:
list_file.append(one_line) #逐行读取Excel文件中的每一行append列表中
list_file.remove(list_file[0]) #该行表示我们去除Excel文件的第一行,因为第一行往往都是数据的名称介绍,如果没有介绍就不用该行代码了
arr_file = np.array(list_file) #转换为矩阵形式
label = arr_file[:,0] #第一列 //该行表示我们取Excel文件中第一列数据进行实验,下述贴出数据样式(或者Excel只有第一列有数据)
然后进行一次额外的筛选,筛选的目的是因为我们所采集到的数据中一般都