pandas 数据导入
在pandas中数据导入有对应的模块;本节解决三个关键问题:
(1)路径斜线问题;
(2)中文路径问题;
(3)编码问题;
正常导入见下,若没问题则完事大吉,但往往没这么顺利。
import pandas as pd
file_path = 'D:/0Raw_data/ftm_p.csv'
data = pd.read_csv(file_path)
1、导入路径斜线问题
当错误类型如下,则一般是路径斜线问题。
ValueError: stat: embedded null character in path
在win中的直接复制的路径,斜线默认是“\”;但在python中路径一般首选是“/”;有3种合理解决方案:
file_path1 = 'D:/0Raw_data/ftm_p.csv'
file_path2 = 'D:\\0Raw_data\\ftm_p.csv'
file_path3 = r'D:\0Raw_data\ftm_p.csv'
2、中文路径问题
当错误类型如下,则一般是中文路径问题。
OSError: Initializing from file failed
不废话,解决方案就是先用open打开,而且一般用open先打开,能直接解决编码问题:
file_path = 'D:/0Raw_data/zhaoyang_charge_sta/京AW7531'
path = open(file_path)
data = pd.read_csv(path)
3、编码问题
当错误类型如下,则一般是编码问题。panda读取时会先检测第一个字符的编码类型,若不是'utf-8'则会报错。
UnicodeD