很多数据是从网上下载而来,数据的格式可能是csv,那么pandas可以很容易的从csv格式的文件中读取数据,下面我们来看看具体的过程:
-
引入pandas

-
使用pandas下的read_csv方法,读取csv文件,参数是文件的路径,这是一个相对路径,是相对于当前工作目录的,那么如何知道当前的工作目录呢?

-
使用os.getcwd()方法获取当前工作目录

-
读取前三后数据,查看一下是否读取正确,显然都是乱码,这是什么问题呢?

-
我们需要设定参数encoding,也就是编码方式,如果你不设定编码方式,默认是utf8,现在csv文件是gbk编码的,所以需要使用encoding='gbk'

-
我用的编辑器是eric4,注意,eric4默认是不支持中文的,如果你想要显示中文,前提是设置正确的编码,在preferences中

-
设置成utf8即可

-
回到pandas,我们可以有更多选项来设置打开数据时的操作:
-

-
-
本文详细介绍了如何使用pandas从csv文件中读取数据,包括引入pandas库,使用read_csv方法读取文件,解决乱码问题及自定义打开数据时的操作。
859

被折叠的 条评论
为什么被折叠?



