numpy 导入数据 ——np.loadtxt()

最新推荐文章于 2025-06-04 21:40:53 发布

ACxz

最新推荐文章于 2025-06-04 21:40:53 发布

阅读量2.2w

点赞数 15

分类专栏： python 数据分析小计 pandas、numpy、matplotlib 文章标签： python 机器学习开发语言数据挖掘数据分析

本文链接：https://blog.youkuaiyun.com/pylittlebrat/article/details/124537229

版权

pandas、numpy、matplotlib 同时被 2 个专栏收录

14 篇文章

订阅专栏

python 数据分析小计

12 篇文章

订阅专栏

np.loadtxt()

np.loadtxt()用于从文本加载数据。

Hint:文本文件中的每一行必须含有相同的数据。

loadtxt(fname, dtype=<class 'float'>, comments='#', delimiter=None, converters=None, skiprows=0, usecols=None, unpack=False, ndmin=0)

fname要读取的文件、文件名、或生成器。

dtype数据类型，默认float。

comments注释。

delimiter分隔符，默认是空格。

skiprows跳过前几行读取，默认是0，必须是int整型。

usecols要读取哪些列，0是第一列。例如，usecols = （1,4,5）将提取第2，第5和第6列。默认读取所有列。

unpack如果为True，将分列读取。

例子

import numpy as np

path = r"C:\Users\pandas\Desktop\task\Factors_Monthly.csv"
# data = pd.read_csv(path)
data = np.loadtxt(path)

ValueError: could not convert string to float: 'yyyymm,year,rf,mktrf,smb,hml'

出现的原因是第一行数据类型与下文的数据数据类型不同。通常跳过第一行，再进行导入。

data = np.loadtxt(path,delimiter = ",", skiprows = 1)
data

array([[ 1.92607e+05,  1.92600e+03,  2.20000e-01,  2.96000e+00,
        -2.30000e+00, -2.87000e+00],
       [ 1.92608e+05,  1.92600e+03,  2.50000e-01,  2.64000e+00,
        -1.40000e+00,  4.19000e+00],
       [ 1.92609e+05,  1.92600e+03,  2.30000e-01,  3.60000e-01,
        -1.32000e+00,  1.00000e-02],
       ...,
       [ 2.01907e+05,  2.01900e+03,  1.90000e-01,  1.19000e+00,
        -2.07000e+00,  1.40000e-01],
       [ 2.01908e+05,  2.01900e+03,  1.60000e-01, -2.58000e+00,
        -2.41000e+00, -4.99000e+00],
       [ 2.01909e+05,  2.01900e+03,  1.80000e-01,  1.44000e+00,
        -8.90000e-01,  6.73000e+00]])