python中遇到中文字符的解决方案（遇到错误：UnicodeDecodeError: 'utf8' codec can't decode byte 0xd1 in position 0）

最新推荐文章于 2024-07-08 23:50:30 发布

bayou3

最新推荐文章于 2024-07-08 23:50:30 发布

阅读量3.8k

点赞数 2

CC 4.0 BY-SA版权

文章标签： python 字符问题

本文链接：https://blog.youkuaiyun.com/bayou3/article/details/86307955

本文介绍了一种解决在读取包含中文、日文等非英文字符文件时出现的UnicodeDecodeError的方法。通过使用'rb'模式打开文件，并在读取时使用decode('utf8','ignore')，可以有效避免解码错误，实现对混合字符文件的正确读取。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

这是我自己遇到的中文字符的情况，报错信息类似于：
UnicodeDecodeError: ‘utf8’ codec can’t decode byte 0xd1 in position 0: invalid continuation byte
最终解决的方案如下

Just using ‘rb’ and decode(‘utf8’,‘ignore’)

比如说要打开一个文件 file.txt，其中的英文字符中还混杂了中文日文等字符，在读写时可以这样做：

with open('path/file.txt','rb') as f:
       lines = f.readlines()
       for line in lines:
            content = line.decode('utf8','ignore')

这样就OK了，是不是很简单！

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

bayou3

关注关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

出现UnicodeDecodeError: ‘ascii‘ codec can‘t decode byte 0xe9 in position 0: ordinal not in range解决方法

码农研究僧的博客

06-21

4060

在传输数据的时候出现这个问题，如下所示：截图如下： python2.7版本：（项目中使用的2版本）： python的编码转换会以unicode作为中间转码（unicode只有128的长度）编码的过程都是先将其Ascii编码字符（默认编码方式）转换成unicode 通过上面的日志可得知无法转码，超出了范围，就报这种错误日志本身编码的时候sys.defaultencoding默认是Ascii，而传入的编码是utf-8，格式不一样，自然就报错了python3版本以上已经兼容了这种问题测试python3

Python 报错 unicodedecodeerror: ‘utf-8‘ codec can‘t decode byte 0x8c

日常学习与专研的记录

03-21

3664

Python 解决读取文件报错 “unicodedecodeerror: ‘utf-8‘ codec can‘t decode byte 0x8c”

参与评论您还未登录，请先登录后发表或查看评论

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd1 in position 0: invalid continuation byte

Trista的博客

07-15

3514

今天读取csv时遇到了报错如下： nicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xd1 in position 0: invalid continuation byte 原本的代码 doctor_info = pd.read_csv("F:/master/offline_of_teamwork/team_doctor_infomation....

python错误解决：UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd1 in position 0: invalid continuat

知易行难，知行合一

04-19

2448

当处理字符文档时出现错误： UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xd1 in position 0: invalid continuation byte 可试一下另存为，将文本文档的编码进行更改为“UTF-8”。

nicodeDecodeError: 'utf-8' codec can't decode byte 0xd1 in position 0: invalid continuation byte

qq_34220460的博客

01-05

5779

遇到这个问题，一般就是文件编码不是utf-8的格式，而系统默认采用的是utf-8的编码，只需要将文件另存为utf-8的格式。

UnicodeDecodeError: 'utf8' codec can't decode byte 0xd1 in position 0: invalid continuation byte解决办法

S_o_l_o_n的博客

05-05

1万+

出现这个问题，首先就是检查源文件的编码方式是不是utf8，这个可以用vscode或者notepad++打开后直接看编码方式，当然也可以用其他方法查看。如果不是utf8编码方式，则自然不能用utf8解码，对此只需要把编码参数设置成对应的编码方式即可。当然，上面说的是最简单基本的解决方式，一般遇到上述问题，如果用各种编辑软件打开源文件后显示的编码方式就是utf8，但是尽...

pytest.ini没有生效出现错误：UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd1 in position 33: invalid continuation byte

06-18

如果遇到 `UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd1 in position 33: invalid continuation byte` 这样的错误，这通常意味着你在 `.ini` 文件中使用了非 UTF-8 编码的文本，而 pytest 预期的是 ...

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd1 in position 1310: invalid continuation byte

最新发布

05-25

当遇到`UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd1 in position 1310: invalid continuation byte`错误时，通常是因为尝试以`utf-8`编码读取一个并非完全遵循该编码规则的文件。以下是针对这一问题...

Python Exception <class 'UnicodeDecodeError'>: 'utf-8' codec can't decode byte 0xd1 in position 7: invalid continuation byte

03-04

当遇到 `UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd1 in position 7: invalid continuation byte` 这样的错误时，通常是因为尝试用 UTF-8 编码读取一个并非以 UTF-8 编码保存的文件。为了处理这种...

yolov5写UI界面遇到的问题SyntaxError: (unicode error) ‘utf-8‘ codec can‘t decode byte 0xd1 in position 0: inv

李明洲的博客

11-23

270

yolov5学习笔记

UnicodeDecodeError: 'utf8' codec can't decode byte 0xd1 in position 0: invalid continuation byte问题

东方电视台的博客

09-16

2万+

在用python编码的时候，想把一txt文件里面的东西，插入到excel表格中，结果出现了UnicodeDecodeError: ‘utf8’ codec can’t decode byte 0xd1 in position 0: invalid continuation byte问题解决方式：在创建表后，加入（1） workbook = xlwt.Workbook(encoding=’ut

‘utf8‘ codec can‘t decode byte 0xd1 in position 931: invalid continuation byte解决方法

wangchaoqi1985的博客

07-31

212

'utf8' codec can't decode byte 0xd1 in position 931: invalid continuation byte解决方法

python程序UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd1 in position 2: invalid continuati

kevinshift的博客

05-10

2241

写了一个python程序，程序最后调用启动http服务监听。将该程序打包成exe程序。

python 报错"UnicodeDecodeError: 'utf-8' codec can't decode byte"的解决办法

热门推荐

米兰小子SHC

09-01

34万+

最近写了一个Python小程序，用来统计《三国演义》中人物出场次数的。从网上下载一个”三国演义.txt”的文件，但是后来程序运行时出现以下报错： UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xa1 in position 0: invalid start byte 后来经过不断查找终于找到了解决办法。由于我在程序中设定文件打开的...

UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd0 in position 0: invalid continuation byte

weixin_43501408的博客

05-19

2313

是因为文件的编码格式不是 UTF-8，而是其他编码格式。在读取文件时，如果指定了错误的编码，解码过程会失败，从而导致此错误。时，Python 会使用默认的系统编码进行读取，如果文件的实际编码与系统默认编码一致，则不会报错。问题解答：把, encoding='utf-8'删掉。

python编码错误：UnicodeDecodeError: 'utf8' codec can't decode

u011528082的专栏

02-12

3万+

python编码错误：UnicodeDecodeError: 'utf8' codec can't decode (2012-11-01 17:16:23) 转载▼ 标签：杂谈分类： python学习笔记这个是在写hive的map脚本时遇到的，基本情况如下： map文件中调用了其他同学的公用函数，在hive脚本中

【Python】已解决：UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xa1 in position 0: invalid start by

屿小夏.的知识博客

07-08

5297

在这个具体的例子中，错误消息 UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xa1 in position 0: invalid start byte 指出，在尝试用 UTF-8 编码解码一个字节序列时，遇到了一个无法识别的起始字节（0xa1）。该错误最常见的原因是文件本身并不是用 UTF-8 编码，而代码尝试以 UTF-8 的方式去解码它。如果你不确定文件的编码，可以尝试使用常见的编码，或者使用工具来检测文件编码。

关于win10使用python遇到UnicodeDecodeError:'utf8' codec can't decode byte 0xd1 in in position 0:invalid的问题

qq_43310054的博客

09-10

965

此问题困扰了我许久开始以为是 python version 的问题装了好几次python 都不管用后来偶然看到和 win10系统的字符集有关只需要修改一下系统字符集问题就解决了浪费了我大把时间没想到会如此容易解决修改系统字符集的办法：见如下网址按照步骤操作即可 http://www.xitongzu.com/jc/29208.html ...

python中遇到中文字符的解决方案 （遇到错误：UnicodeDecodeError: 'utf8' codec can't decode byte 0xd1 in position 0）

python中遇到中文字符的解决方案（遇到错误：UnicodeDecodeError: 'utf8' codec can't decode byte 0xd1 in position 0）