Python之检测文件的字符编码（chardet）

原创于 2017-11-06 19:00:26 发布 · 2.2w 阅读

CC 4.0 BY-SA版权

文章标签：

55 篇文章

订阅专栏

本文介绍了一次解决Markdown文件因错误编码导致乱码的经历。通过检测发现文件使用了UTF-16LE编码而非常见的UTF-8编码。文章提供了一个简单的Python脚本，用于检测文件的实际编码。

使用某编辑器编辑完MD文档保存之后没注意编码，再次重新打开之后一片乱码，再尝试过常见的几种字符编码之后还是不行。只能检测字符编码了，检测完之后居然用了UTF-16 LE编码。

#coding=utf-8
import codecs ,chardet

with codecs.open("1.txt","rb") as f:
    data = f.read()
    print(chardet.detect(data))