首先使用np.array()函数把DataFrame转化为np.ndarray(),再利用tolist()函数把np.ndarray()转为list,示例代码如下:
<br /># -*- coding:utf-8-*- import numpy as np import <span class="wp_keywordlink_affiliate"><a href="https://www.168seo.cn/tag/pandas" title="View all posts in pandas" target="_blank">pandas</a></span> as pd data_x = pd.read_csv("E:/Tianchi/result/features.csv",usecols=[2,3,4])#pd.dataframe data_y = pd.read_csv("E:/Tianchi/result/features.csv",usecols=[5])usecols : array-like, default None #返回一个数据子集,该列表中的值必须可以对应到文件中的位置(数字可以对应到指定的列)或者是字符传为文件中的列名。 #例如:usecols有效参数可能是 [0,1,2]或者是 [‘foo’, ‘bar’, ‘baz’]。使用这个参数可以加快加载速度并降低内存消耗。 train_data = np.array(data_x)#np.ndarray() train_x_list=train_data.tolist()#list print(train_x_list) print(type(train_x_list))
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
<
br
/
>
# -*- coding:utf-8-*-
import
numpy
as
np
import
pandas
as
pd
data_x
=
pd
.
read_csv
(
"E:/Tianchi/result/features.csv"
,
usecols
=
[
2
,
3
,
4
]
)
#pd.dataframe
data_y
=
pd
.
read_csv
(
"E:/Tianchi/result/features.csv"
,
usecols
=
[
5
]
)
usecols
:
array
-
like
,
default
None
#返回一个数据子集,该列表中的值必须可以对应到文件中的位置(数字可以对应到指定的列)或者是字符传为文件中的列名。
#例如:usecols有效参数可能是 [0,1,2]或者是 [‘foo’, ‘bar’, ‘baz’]。使用这个参数可以加快加载速度并降低内存消耗。
train_data
=
np
.
array
(
data_x
)
#np.ndarray()
train_x_list
=
train_data
.
tolist
(
)
#list
print
(
train_x_list
)
print
(
type
(
train_x_list
)
)
|
5万+

被折叠的 条评论
为什么被折叠?



