Python 将每行的前len-1列数据抽成一个矩阵,将最后的一列作为另一个矩阵

文件解析与数据组织
本文介绍了一个Python函数loadDataSet(fileName),该函数从指定文件中读取tab分隔的数据,并将其组织为两个矩阵:一个包含所有行的前len-1列数据,另一个包含最后一列数据。示例展示了如何使用此函数处理包含两列数据和一列标签的文件。
作用:将每行的前len-1列数据抽成一个矩阵,将最后的一列作为另一个矩阵
每行各数据间隔是tab(
\t
)
def loadDataSet(fileName):      #general function to parse tab -delimited floats
    numFeat = len(open(fileName).readline().split('\t')) - 1 #get number of fields
    print "numFeat:",numFeat
    dataMat = []; labelMat = []
    fr = open(fileName)
    for line in fr.readlines():
        lineArr =[]
        curLine = line.strip().split('\t')
        for i in range(numFeat):
            print "i:",i
            lineArr.append(float(curLine[i]))
        dataMat.append(lineArr)
        labelMat.append(float(curLine[-1]))
    return dataMat,labelMat
数据:
1.000000	0.067732	3.176513
1.000000	0.427810	3.816464
输出结果:
矩阵1:
dataMat:[[1.0, 0.067732], [1.0, 0.42781]]
矩阵2:
labelMat: [3.176513, 3.816464]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值