在用pd.read_csv读数据时,将要转换数据类型的列名和类型名构成字典,传给dtype
import numpy as np
import pandas as pd
path = 'house_data.csv'
col = ['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS',
'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT', 'MEDV']
dict_dtype = {}
for i in col:
dict_dtype[i] = np.float64
# print(dict_dtype)
data = pd.read_csv(path, header=None, names=col, sep=',', dtype=dict_dtype)
本文介绍如何利用Pandas库中的read_csv函数,通过指定数据类型来优化CSV文件的读取效率。通过构建字典指定列的数据类型,避免了不必要的类型转换,加快了数据加载速度。
3360

被折叠的 条评论
为什么被折叠?



