最近在做机器学习相关的建模工作,那么numpy这个数据工具包,也就是必不可少的啦,关于numpy的常用使用,我在后续进行补充,现在这里主要来说一下,关于numpy进行读取列的常见问题
我们经常会有这样的问题,当我们拿到一个数据集(比如说:数据的csv文件),那么我们在进行数据提取时候,X和y要对应不同的列,主要针对X我们的处理可能多一些,如果我们的数据特征比较少,那么我们知道我们要读取对应的列,比如可能只读第1、2、3、4列,那么这个怎么读,我们有具体的方法,如果我们的数据特征特别多,比如有200个,那么我们需要如何进行读取呢?
这里给出对应的读取方法:
首先我们需要知道,设定读取行的方法的参数为 usecols=() 括号里面的内容来限定对应的读取列
1.只读取第1、2、3、4列:
x = np.loadtxt("./data.csv", skiprows=1,delimiter=",",usecols=(0,1,2,3))
2.只读取第一列:
x = np.loadtxt("./data.csv", skiprows=1,delimiter=",",usecols=(0,)) #注意后面需要逗号
2.读取1-200列:
x = np.loadtxt("./data.csv", skiprows=1,delimiter=",",usecols=np.arange(0,200)) #注意后面多了 np.arange
最后,当然要使用numpy,一定不要忘了需要import numpy包哦:
import numpy as np
===========
我是晶心,一个努力进阶的程序媛,欢迎我们一起交流学习~
===========