pandas将表中的字符串转成数值型

最新推荐文章于 2024-08-06 12:50:48 发布

原创最新推荐文章于 2024-08-06 12:50:48 发布 · 1.4w 阅读

16 ·

CC 4.0 BY-SA版权

文章标签：

#pandas转数据类型

pandas 专栏收录该内容

14 篇文章

订阅专栏

本文介绍如何利用Pandas库中的read_csv函数，通过指定数据类型来优化CSV文件的读取效率。通过构建字典指定列的数据类型，避免了不必要的类型转换，加快了数据加载速度。

在用pd.read_csv读数据时，将要转换数据类型的列名和类型名构成字典，传给dtype

import numpy as np
import pandas as pd

path = 'house_data.csv'
col = ['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS',
       'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT', 'MEDV']
dict_dtype = {}
for i in col:
    dict_dtype[i] = np.float64
# print(dict_dtype)

data = pd.read_csv(path, header=None, names=col, sep=',', dtype=dict_dtype)