解决Python读取文件时出现编码异常

解决Python读取HTML文件编码错误

最新推荐文章于 2025-06-29 14:50:54 发布

枫奇

最新推荐文章于 2025-06-29 14:50:54 发布

阅读量4.1k

点赞数 1

分类专栏： pyhthon安装以及错误处理文章标签： python 编码错误

pyhthon安装以及错误处理专栏收录该内容

23 篇文章

订阅专栏

本文介绍了一种常见的Python读取HTML文件时遇到的UnicodeDecodeError问题及其解决方案。通过指定正确的文件编码格式（如UTF-8），可以避免Python在读取文件时出现解码错误。

解决Python读取文件时出现UnicodeDecodeError: 'gbk' codec can't decode byte...

用Python在读取某个html文件时会遇到下面问题:

出问题的代码:

1 if __name__ == '__main__':
2     fileHandler = open('../report.html', mode='r')
3 
4     report_lines = fileHandler.readlines()
5     for line in report_lines:
6         print(line.rstrip())

修改方式是在open方法指定参数encoding='UTF-8':

if __name__ == '__main__':
    fileHandler = open('../report.html', mode='r', encoding='UTF-8')

    report_lines = fileHandler.readlines()
    for line in report_lines:
        print(line.rstrip())