关于pandas读取csv文件时出现UnicodeDecodeError

最新推荐文章于 2023-12-29 15:21:28 发布

WUNNAN

最新推荐文章于 2023-12-29 15:21:28 发布

阅读量1.7k

点赞数

分类专栏： ERROR 文章标签： pandas python 开发语言

本文链接：https://blog.youkuaiyun.com/weixin_51154479/article/details/128273538

版权

ERROR 专栏收录该内容

9 篇文章

订阅专栏

本文介绍了在使用pandas读取CSV文件时遇到的两种常见UnicodeDecodeError，并提供了相应的解决方案。一种是在位置0处遇到无效的起始字节，另一种是在特定位置遇到无效的后续字节。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

错误１：UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xb8 in position 0: invalid start byte

问题描述

运行如下代码时报错

UnicodeDecodeError                        Traceback (most recent call last)
pandas\_libs\parsers.pyx in pandas._libs.parsers.TextReader._convert_tokens()

pandas\_libs\parsers.pyx in pandas._libs.parsers.TextReader._convert_with_dtype()

pandas\_libs\parsers.pyx in pandas._libs.parsers.TextReader._string_convert()

pandas\_libs\parsers.pyx in pandas._libs.parsers._string_box_utf8()

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb8 in position 0: invalid start byte

解决方案

在read_csv函数中添加参数

encoding="gbk"

错误２：UnicodeDecodeError: ‘utf-8’ codec can’t decode bytes in position 42-43: invalid continuation byte

问题描述

UnicodeDecodeError                        Traceback (most recent call last)
pandas\_libs\parsers.pyx in pandas._libs.parsers.TextReader._convert_tokens()

pandas\_libs\parsers.pyx in pandas._libs.parsers.TextReader._convert_with_dtype()

pandas\_libs\parsers.pyx in pandas._libs.parsers.TextReader._string_convert()

pandas\_libs\parsers.pyx in pandas._libs.parsers._string_box_utf8()

UnicodeDecodeError: 'utf-8' codec can't decode bytes in position 42-43: invalid continuation byte