我学Python遇到的那些问题——txt文件解码不成功

本文探讨了Python在处理不同编码格式的文本文件时遇到的问题,如UnicodeDecodeError。通过案例分析,解释了当文件编码为非UTF-8(如GBK或ANSI)时,不指定解码方式会导致的错误。解决方案包括:1) 将中文字符替换为英文;2) 明确指定文件的解码方式,如使用`encoding=utf-8`;3) 检查并转换文件编码至统一标准。此外,强调了查看和确认文件编码的重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

文本文件读写:显示 UnicodeDecodeError: 'gbk' codec can't decode byte 0xad in position 2: illegal multibyte sequence

#代码
textFile = open("7.1.txt","rt")
print(textFile.readline())
textFile.close()
#运行结果
UnicodeDecodeError: 'gbk' codec can't decode byte 0xad in position 2: illegal multibyte sequence

1.初步解决方法:把txt文件中的中文字符用英文表达后运行成功;

2. 指定解码方式:utf-8

textFile = open("7.1.txt","rt", encoding="utf-8")

3.更换为另一个txt文件后成功打开

textFile = open("《哈姆雷特》.txt","rt")
print(textFile.readline())
textFile.close()

根据以上操作怀疑是两个文件的编码格式不一样,于是查看了两个txt的编码格式,打开文本文件——文件——另存为——编码格式,一个是utf-8,另一个是ANSI。说明python语言不指定解码方式,只能直接打开ANSI编码的文件,其他编码方式(utf-16)也不能直接打开。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值