用pandas读取csv文件出现问题

最新推荐文章于 2022-12-11 12:30:54 发布

原创最新推荐文章于 2022-12-11 12:30:54 发布 · 4.2k 阅读

2 ·

CC 4.0 BY-SA版权

本文探讨了使用pandas库在Python中读取CSV文件时遇到的错误，并通过更改engine参数解决了问题。此外，还介绍了如何正确显示DataFrame的所有列，包括将文件名改为英文格式。

读取csv文件

first = pd.read_csv(r'C:\Users\lenovo\Desktop\广州.csv',encoding="utf-8")
second = pd.read_excel(r'C:\Users\lenovo\Desktop\网点规则调整申请表_20181219_紧急需求.xlsx')
# first = first[['']]
print(first.columns)

结果：

D:\Anaconda_chengxuwenjian\python.exe E:/pycharm建立的Python_Project/用python进行数据分析/修改进行检查.py
Traceback (most recent call last):
File "E:/pycharm建立的Python_Project/用python进行数据分析/修改进行检查.py", line 8, in <module>
first = pd.read_csv(r'C:\Users\lenovo\Desktop\广州.csv',encoding="utf-8")
File "D:\Anaconda_chengxuwenjian\lib\site-packages\pandas\io\parsers.py", line 678, in parser_f
return _read(filepath_or_buffer, kwds)
File "D:\Anaconda_chengxuwenjian\lib\site-packages\pandas\io\parsers.py", line 440, in _read
parser = TextFileReader(filepath_or_buffer, **kwds)
File "D:\Anaconda_chengxuwenjian\lib\site-packages\pandas\io\parsers.py", line 787, in __init__
self._make_engine(self.engine)
File "D:\Anaconda_chengxuwenjian\lib\site-packages\pandas\io\parsers.py", line 1014, in _make_engine
self._engine = CParserWrapper(self.f, **self.options)
File "D:\Anaconda_chengxuwenjian\lib\site-packages\pandas\io\parsers.py", line 1708, in __init__
self._reader = parsers.TextReader(src, **kwds)
File "pandas\_libs\parsers.pyx", line 384, in pandas._libs.parsers.TextReader.__cinit__
File "pandas\_libs\parsers.pyx", line 697, in pandas._libs.parsers.TextReader._setup_parser_source
OSError: Initializing from file failed

有看了下 pandas.read_csv 的官方文档，可能与

engine : {‘c’, ‘python’}, optional

Parser engine to use. The C engine is faster while the python engine is currently more feature-complete.

将engine 改为python

first = pd.read_csv(r'C:\Users\lenovo\Desktop\广州.csv',engine='python',encoding="utf-8")
second = pd.read_excel(r'C:\Users\lenovo\Desktop\网点规则调整申请表_20181219_紧急需求.xlsx')
# first = first[['']]
print(first.columns)

结果：

D:\Anaconda_chengxuwenjian\python.exe E:/pycharm建立的Python_Project/用python进行数据分析/修改进行检查.py
Index(['网点ID'], dtype='object')

Process finished with exit code 0

Dataframe的columns总是显示第一个，后面的都显示不出来，把csv的文件名改成英文格式，同时把engine改成默认的c

first = pd.read_csv(r'C:\Users\lenovo\Desktop\guangzhou.csv',engine ='c',encoding="utf-8")
second = pd.read_excel(r'C:\Users\lenovo\Desktop\网点规则调整申请表_20181219_紧急需求.xlsx')
# first = first[['']]
print(first.columns)

结果：

D:\Anaconda_chengxuwenjian\python.exe E:/pycharm建立的Python_Project/用python进行数据分析/修改进行检查.py
Index(['网点ID', '网点名称', '城市', '区县', '网点地址', '设备数量', '投件规则名', '小箱折后价', '中箱折后价',
       '大箱折后价', '取件规则名', '免费时长', '基础时长', '基础费用', '超期时长', '超期费用', '代存服务费折扣',
       '代存服务费封顶', '封顶费', '周末节假日计时', '投件当日夜间计时', '短信模板名', '开箱码迁移是否开启',
       '投件补发短信时间', '自动取件短信模板', '补发短信模板', '预约规则名', '大箱实际预约价', '中箱实际预约价',
       '小箱实际预约价', '滞留件规则', '自动补发短信模板'],
      dtype='object')

Process finished with exit code 0

正常显示