在python中导入csv文件中的数据的方法

最新推荐文章于 2025-07-13 11:13:08 发布

原创最新推荐文章于 2025-07-13 11:13:08 发布 · 2.6w 阅读

59 ·

CC 4.0 BY-SA版权

文章标签：

#python #csv #矩阵 #数据

本文介绍两种在Python中导入CSV文件数据的方法，一是直接使用numpy的loadtxt函数，二是将CSV转换为TXT后导入。详细解释了如何处理逗号分隔符和Tab分隔符，以及如何将数据和标签分离。

在python中导入csv文件中的数据为矩阵的方法

因为初学python和深度学习，因此总是在导入一些csv，txt文件时遇到一些莫名其妙的错误或者问题，因此在这里总结了一下我导入数据的办法，也供大家参考。

方法一

csv文件，即逗号分隔值文件格式，是以逗号作为默认分隔符的一种保存数据的文件。在这里要特别注意，那个逗号不一定可以看到！之前我在网上查到的资料中，csv文件中的逗号都是直接显示的，但是在我的电脑上，csv文件中的显示如下：

从图中可以看出，在我的电脑上，csv文件中的逗号并没有显示，使得一开始我误以为csv文件没有默认逗号，还尝试添加逗号，但实际上csv文件的数据之间默认用逗号做了分隔符，不需要添加任何额外分隔符！为了证明文件中确实使用逗号作为分隔符，只需要在打开方式中选择记事本，便可以看到隐藏的逗号分隔符：
这里写图片描述

以上述的简单2*3矩阵为例，我需要将第一列作为标签，后两列作为特征数据以矩阵行驶导入python，分别生成矩阵label和data，则应该将该csv文件放在当前工程所在的路径下，然后使用如下代码（我的csv文件名为test3.csv）：

import numpy as np
tmp = np.loadtxt("test3.csv", delimiter=",")
tmp1=np.array(tmp)
data = tmp1[0:, 1:]  # 加载数据部分
label = tmp1[0:, 0]  # 加载类别标签部分
label = np.asarray(label).astype('float32')  # 加载类别标签部分
pass #调试点，导入了data为数据，label为标签

通过上述代码，便得到了矩阵data和label，即为我们所学要的数据和标签矩阵。

方法二

除此之外，也可以将csv文件中的数据复制到一个txt文本文件中，然后导入该文本文件，复制过来的数据显示如下：
这里写图片描述
此时，应将默认的分隔符改为Tab健，上述代码中，加载文件语句应修改为如下所示，语句中，使用转义字符\t来表示Tab键：

tmp = np.loadtxt("a.txt", dtype=np.str, delimiter="\t")

综上，修改后使用的代码如下（txt文件名为a.txt）：

import numpy as np
tmp = np.loadtxt("a.txt", dtype=np.str, delimiter="\t")
tmp1=np.array(tmp)
data = tmp1[0:, 1:]  # 加载数据部分
label = tmp1[0:, 0]  # 加载类别标签部分
label = tmp1[0:, 0].astype(np.float)  # 加载类别标签部分
pass #调试点，导入了data为数据，label为标签