Python3 pandas读取csv文件编码报错问题

最新推荐文章于 2023-08-29 16:12:10 发布

原创最新推荐文章于 2023-08-29 16:12:10 发布 · 886 阅读

1 ·

CC 4.0 BY-SA版权

Python 专栏收录该内容

1 篇文章

订阅专栏

本文描述了使用Python2处理数据并保存为CSV后，在Python3中读取时遇到的UnicodeDecodeError错误。提供了通过Sublime Text更改文件编码为UTF-8的解决方案。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

问题起因

我用python2清洗数据，并存到csv文件中

payloads.to_csv('data/payloads.csv')

用python3读取csv文件时，报一下错误：

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x89 in position 32: invalid start byte

解决方法：使用sublime打开csv文件，选择file并Save with encoding -> UTF-8即可。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

人见棱爱

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

python3利用pandas读取csv文件的报错UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd0 in position X

m0_37936453的博客

03-04

3099

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd0 in position X Unicode的解码错误：使用'utf-8'无法解码在X位置的0xd0字符 bug原因：这个csv文件在写入时的编码并不是用utf-8写入的，所以在读取的解码过程中（用utf-8解码），就会报错所以解决这个问题就需要知道这个csv文件写入时是用哪种编...

python导入数据文件报错：UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0x98 in position 16: invalid

m0_50707858的博客

10-22

2221

做数据分析作业时，导入csv文件 import pandas as pd test_df=pd.read_csv(r'D:\数据科学\实验二数据统计分析\data2.csv') print(test_df.head()) 运行后报错：即如题所述问题首先看了下导入语法，贴个链接 https://www.cnblogs.com/OliverQin/p/8966321.html 语法写的应该没啥问题然后看到了这篇文章： https://blog.youkuaiyun.com/qq_35892623/article

参与评论您还未登录，请先登录后发表或查看评论

解决Python中pandas读取*.csv文件出现编码问题

09-19

很多朋友在使用Python中pandas读取csv文件时，出现编码格式问题，接下来通过本文给大家分享解决Python中pandas读取*.csv文件出现编码问题,需要的朋友可以参考下

python使用pandas读取csv文件报错UnicodeDecodeError

CXBin129的博客

01-10

1112

转载：原文版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。本文链接：https://blog.youkuaiyun.com/weixin_40769885/article/details/82288553 报错代码： df = pd.read_csv(filename) 报错UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xd1 in position 87: invalid continuation

Python使用pandas读取csv文件支持utf-8和gbk编码自动识别

07-30

Python 简单使用 pandas 读取excel 的 csv文件处理，支持utf-8和gbk编码自动识别。

Python Pandas批量读取csv文件到dataframe的方法

09-20

3. **读取CSV文件**： - Pandas提供了`pd.read_csv()`函数，它用于读取CSV文件。例如，`df=pd.read_csv('filename.csv')`读取名为`filename.csv`的文件。 - 参数`header=None`表示CSV文件中没有列标题，`sep=''`...

Python中pandas读取csv文件实现utf-8与gbk编码自动识别

最新发布

07-03

在使用Python进行数据分析的过程中，pandas库是一个十分强大的工具，它提供了大量的方法来处理各种数据集，其中读取CSV文件是最基本的操作之一。CSV文件作为一种简单、广泛使用的数据交换格式，经常包含着大量的文本...

python pandas读取各种编码方式的csv文件

m0_46663205的博客

12-07

2367

python pandas读取各种编码方式的csv文件

python3读取csv中有中文_python3 库pandas写入csv格式文件出现中文乱码问题解决方法...

weixin_39632379的博客

12-03

1279

python3 库pandas写入csv格式文件出现中文乱码问题解决方法解决方案：问题是使用pandas的DataFrame的to_csv方法实现csv文件输出，但是遇到中文乱码问题，已验证的正确的方法是：df.to_csv("cnn_predict_result.csv")更改为：df.to_csv("cnn_predict_result.csv",encoding="utf_8_sig")核心...

pandas读取csv文件报：UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xad in position 0: invalid start

z917185537的专栏

06-07

674

问题：通过pandas.read_csv("file",encoding="utf-8")读取文件报异常UnicodeDecodeError: 'utf-8' codec can't decode byte 0xad in position 2: invalid start byte，如图所示：原因：由于被读取的文件格式不是utf-8格式，而encoding参数设置的utf-8 解决办法：修改文件的格式为utf-8 查看文件的编码格式使用notepad++打开文件，可以看到右下角是文件的编码格式

python处理pandas读取文件名有中文报错问题解决方法

05-17

python处理pandas读取文件名有中文报错问题解决方法，

python3,csv多列提取重新生成csv

11-14

本资源可以接受中文的表内容（如果编码格式报错，在导入的部分修改编码格式gbk或者utf8即可），可以任意抽取原csv文件的多个列数据，重新制表生成新的csv文件。

python读取csv文件报：DecodeError: ‘utf-8‘ codec can‘t decode byte 0xc8 in position 2: invalid continuation

qq_25368751的博客

10-10

1048

解决python读取文件错误

在pandas导入csv文件时出现 ‘utf-8‘ codec can‘t decode

weixin_40589196的博客

08-29

2059

是因为csv文件中存在中文编码解码与python不一致，需修改读时的的解码器，中文一般有四类编码，将 encoding=’utf-8’ 改为GB2312、gbk、ISO-8859-1，随便尝试一个均可以。

读取csv文件报错utf-8‘ codec can‘t decode byte

LzayaAckerman的博客

07-14

2431

文件读取报错处理

解决问题pandas ‘utf-8‘ codec can‘t decode byte 0xbb in position 16: invalid start byte

xiaowangshu23的博客

07-17

1964

解决问题pandas 'utf-8' codec can't decode byte 0xbb in position 16: invalid start byte问题描述解决方法总结问题描述环境：tensorflow2.10 pandas 问题：解决方法原句：pd.read_csv(“F:\amazon_cells_labelled.txt”,names=[‘sentence’,‘label’],sep=’\t’) 将文件名修改为非a开头的名字即可修改后：pd.read_csv(“F:\ya

（python）pd.read_csv出现乱码

灰羽

05-12

9440

【错误】 ‘utf8’ codec can’t decode byte 0xc3 in position 0: invalid continuation byte 代码： import pandas as pd filename='B_StationInfo_brief.csv' data_csv=pd.read_csv(filename,encoding='utf-8') print d...

【报错】 ‘utf-8‘ codec can‘t decode byte 0xc8 【出现在】python open pd.read_csv()

Sevieryang/FinTech/Statistics/Quant

11-19

1797

报错： python在open读取txt文件时，出现UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xc8 in position 0: invalid continuation byte报错解决办法：把原来的txt文件重新打开另存为的时候，把编码方式修改为utf-8，然后代码的encoding=‘utf-8’保持不变即可 ...

python 使用pandas读取csv文件

06-06

### 如何使用 Pandas 在 Python 中读取 CSV 文件在 Python 中，Pandas 是一个强大的数据分析库，提供了简单易用的接口来处理 CSV 文件。以下是一个详细的说明和示例代码。要读取 CSV 文件，可以使用 `pandas.read_csv()` 方法[^1]。此方法允许指定文件路径、编码方式以及其他参数以适应不同的文件格式需求。例如，如果文件包含中文字符，可能需要设置适当的编码格式（如 `gbk` 或 `utf-8`）[^1]。以下是使用 Pandas 读取 CSV 文件的基本示例代码： ```python import pandas as pd # 指定文件路径和编码方式 df = pd.read_csv('property-data.csv', encoding="gbk") # 使用 gbk 编码处理中文字符 print(df.to_string()) # 打印整个 DataFrame 的内容 ``` 在上述代码中： - `'property-data.csv'` 是目标 CSV 文件的路径。 - `encoding="gbk"` 指定了文件的编码格式，适用于包含中文字符的文件[^1]。 - `df.to_string()` 将整个 DataFrame 转换为字符串并打印，确保输出所有行和列。此外，还可以通过传递自定义列名来读取 CSV 文件。例如： ```python import pandas as pd # 自定义列名 df = pd.read_csv('data.csv', names=['ts_code', 'symbol', 'name', 'area', 'industry', 'list_date'], index_col=None) print(df.head()) # 显示前几行数据 ``` 在此代码中： - `names` 参数用于定义自定义列名[^4]。 - `index_col=None` 表示不将任何列设置为索引[^4]。 ### 高级功能如果需要逐行读取大型 CSV 文件，可以结合 `chunksize` 参数分块读取，避免内存不足的问题[^2]： ```python import pandas as pd # 分块读取 CSV 文件 chunk_size = 1000 # 每次读取的行数 chunks = [] for chunk in pd.read_csv('large_file.csv', chunksize=chunk_size): chunks.append(chunk) # 合并所有分块 df = pd.concat(chunks, ignore_index=True) print(df.head()) ``` 以上代码展示了如何通过分块读取大型 CSV 文件，并将其合并为一个完整的 DataFrame[^2]。 ---