这篇博客记录了利用python读取txt文件的方法,暂且只记录了一个比较简单的方法。如有需要,之后还会添加新的方法。
先看我们要处理的数据:
其中前三列是特征数组,最后一列是标签。
程序如下:
dataMat=[];
labelMat=[];
fr=open(filename)
for line in fr.readlines():
lineArr=line.strip().split('\t')
dataMat.append([float(lineArr[0]),float(lineArr[1]),float(lineArr[2])])
labelMat.append(lineArr[3])
需要注意一下几点:
1. 利用python 内置的list数据结构来逐行存储数据,但在计算矩阵的时候最好转换成numpy的array形式来处理:dataMat=array(dataMat)
2. 对lineArr[0]进行float转换,否则读完之后是string类型
本文介绍了一种使用Python从TXT文件中读取数据的方法。具体步骤包括打开文件、逐行读取并按制表符分隔每行数据,同时将特征数组转换为浮点数类型,标签保留为字符串类型。
2966

被折叠的 条评论
为什么被折叠?



