python读文件时报错UnicodeDecodeError-笔记

原创已于 2025-04-29 15:50:08 修改 · 5.3k 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#python #编码

于 2017-12-04 19:33:52 首次发布

python笔记专栏收录该内容

32 篇文章

订阅专栏

本文针对Python读取文件时出现的UnicodeDecodeError进行了详细的解析，并提供了四种解决方案，包括更改编码方式、使用更大范围的编码标准、忽略无法解码的字符等。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.背景

使用python的时候经常会遇到文本的编码与解码问题，其中很常见的一种解码错误如下所示：

UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal multibyte sequence

2. 解决方案

2.1 二进制模式

对于非文本文件（如图片、二进制日志等），直接将文件内容以 字节（bytes） 形式读取，不进行编码解码

FILE_OBJECT= open('order.log','rb')

2.2 文本模式

对于文本文件，文件内容需要被解码为字符串（str），可通过 encoding 参数指定具体的编码格式。

step1.首先在打开文本的时候，设置其编码格式为gbk：

FILE_OBJECT= open('1.txt', encoding='gbk')

step2. 若gbk不能解决，可能是文本中出现的一些特殊符号超出了gbk的编码范围，可以选择编码范围更广的‘gb18030’ 或 UTF-8；

FILE_OBJECT= open('1.txt', encoding='gb18030')

或
FILE_OBJECT= open('order.log','r', encoding='UTF-8')

step3. 若step2仍不能解决，说明文中出现了连‘gb18030’也无法编码的字符，可以使用‘ignore’属性进行忽略：

FILE_OBJECT = open('1.txt', encoding='gb18030',errors=‘ignore’)

或
FILE_OBJECT = open(‘1.txt’).read().decode(‘gb18030’,’ignore’)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

饕餮争锋

关注关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Python 报错 unicodedecodeerror: ‘utf-8‘ codec can‘t decode byte 0x8c

日常学习与专研的记录

03-21

3696

Python 解决读取文件报错 “unicodedecodeerror: ‘utf-8‘ codec can‘t decode byte 0x8c”

python 读取csv文件和 UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa8 in position问题...

Lucky小黄人的博客

12-25

2597

python 读取csv文件，无法读取第一列的数据，不知道为什么。以后有时间再来研究 import os import csv import json fw = open("data_json.py", "w") index = 0 with open("log_test/tests/data.csv", "r", newline='', encoding= u'utf-8',errors=...

参与评论您还未登录，请先登录后发表或查看评论

UnicodeDecodeError: 'gbk' codec can't decode byte 0xab in position 11126: illegal multibyte sequence

最新发布

2501_91466945的博客

06-06

315

摘要：在Python中处理文件时，建议将文件打开模式从默认的文本模式改为二进制模式('rb')以避免编码问题。当使用默认的with open(opt.data) as f:方式可能会遇到编码错误，应修改为with open(opt.data, 'rb') as f:。这种修改尤其适用于处理未知编码或二进制文件的情况，能有效解决因编码问题导致的读取失败。二进制模式直接读取字节而不进行解码，确保文件内容被正确读取。

UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xab in position 11126: illegal multibyte sequence

Recently祝祝的博客

07-29

293

python读取文件中含有中文时，会报错：解决办法是：打开文件时以utf-8格式打开，同样适用于gbk 输出成功：

python用execjs执行接js解密时报错 UnicodeDecodeError ‘gbk‘ codec can‘t decode byte 0x86

NUT_0的博客

03-09

859

python 引用execjs 执行js脚本时编码错误问题

写入csv文件时报错UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb2 in position 9: invalid start byte

04-26

当你在写入CSV文件时遇到UnicodeDecodeError错误，通常是因为文件中包含了无法使用UTF-8编码解码的字符。UTF-8是一种常用的字符编码方式，但并不是所有字符都可以使用UTF-8编码表示。要解决这个问题，你可以尝试...

python 合并csv文件的问题：UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xba in position 0、csv中文乱码

weixin_42827025的博客

12-29

1429

合并csv文件遇到的问题问题一：UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xba in position 0: invalid start byte 问题二：csv中文乱码最后附上csv文件合并的代码问题一：UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xba in position 0: invalid start byte 解决办法：设置read_csv编码格式，添加

UnicodeDecodeError: 'gbk' codec can't decode byte 0xab in position 56: illegal multibyte sequence

weixin_42596246的博客

02-12

3385

这是一个Python程序遇到的错误信息。它表示在使用GBK编码解码数据时遇到了非法字节，具体位置为56。这通常是由于试图使用GBK编码解码非GBK编码的数据导致的。要解决这个问题，可以尝试使用正确的编码方式解码数据，或者在读取数据之前先对数据进行转码。 ...

解决UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xab in position 28: illegal multibyte sequence

牛肉胡辣汤

10-14

2万+

在处理文本文件时，错误是一个常见的问题。本文介绍了三种解决方法：指定正确的编码格式、使用适当的错误处理方法和尝试不同的编码格式。根据实际情况选择合适的方法，我们可以成功解决错误，并顺利处理文本文件的内容。假设我们有一个名为data.txt的文本文件，其中包含一些文本数据。我们想要读取该文件并处理其中的内容。以下是一个示例代码，演示了如何解决try:# 处理文件内容# 在这里处理每行文本的逻辑。

解决报错：UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xab in position 105: illegal multibyte seque

magicnnonn的博客

04-22

927

解决报错：UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xab in position 105: illegal multibyte sequence 目标检测YOLO系列转数据集格式的时候报错如下：最后发现是编码器的问题，解决方法如下： def convert_annotation(image_id): in_file = open('data/Annotations/%s.xml' % (image_id), 'r', encoding

解决UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xba in position 2: illegal multibyte sequence

牛肉胡辣汤

10-20

2万+

UTF-8编码使用变长的字节序列来表示不同范围的字符，使得它能够表示任意字符，包括ASCII字符和非ASCII字符。比如，如果文件是使用UTF-8编码的，而程序中使用了GBK解码，就会产生该错误。然而，由于字符编码的问题，有时候会遇到。如果不确定文件的编码方式，或者文件同时包含多种编码方式，可以使用自动检测编码的库来解决该问题。这样，在读取文件内容时，如果遇到无法解码的字符，将会忽略该错误继续处理文件的其他内容。，但其中可能存在某些字符无法解码的情况，我们希望忽略这些错误并继续处理文件的其他内容。

python：读取文件内容解码编码错误 UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xab in position 2: illegal

BA的专栏

11-30

5615

错误1：UnicodeDecodeError: 'gbk' codec can't decode byte 0xab in position 2: illegal multibyte sequence 错误2：unicodeescape codec can t decode bytes in position 2-3: truncated UXXXXXXXX escape

Python读取文件时出现UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x80 in position ...

qq_31267769的博客

10-17

6万+

with open(self.path, 'r') as test: for line in test: pass 代码如上，出现错误：UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position ... UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 9: ... 或者是 UnicodeDecodeErr..

UnicodeDecodeError: 'gbk' codec can't decode byte 0x80

kakazai.cn

03-23

2万+

文章目录问题原因解决方法问题在打开一个html文件的时候，提示UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0x80。 Unicode解码错误：gbk编码无法被解码。原因要打开的文件是UTF-8编码，用记事本打开再另存为可以看到文件的编码。文件虽然是utf8编码，但是在计算机里面存储的还是unicode编码数据，即计算机是将文件...

解决问题：UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x80 in position 85: illegal multibyt

qq_40280673的博客

10-31

2048

解决问题：UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 85: illegal multibyt