# -*- coding: utf-8 -*-
import re
import os
import sys, codecs
import chardet
def detect_codec(file_name):
f = open(file=file_name, mode='rb')
data = f.read()
print(chardet.detect(data))
return chardet.detect(data)["encoding"]
def replace_comment(in_file, out_file):
if not os.path.exists(in_file):
return
encode = detect_codec(in_file)
f0 = open(in_file, "r", encoding=encode)
str = f0.read()
f1 = open(out_file, "w", encoding=encode)
f1.write(str)
f0.close()
f1.close()
if __name__=='__main__':
replace_comment("E:\\WorkSpace\\utf8-bom.hpp", "E:\\WorkSpace\\utf8-bom-w.hpp")
replace_comment("E:\\WorkSpace\\utf8-nobom.hpp", "E:\\WorkSpace\\utf8-nobom-w.hpp")
replace_comment("E:\\WorkSpace\\ansi.hpp", "E:\\WorkSpace\\ansi-w.hpp")
Python检测文件格式并且写入正确格式
最新推荐文章于 2025-01-15 14:57:25 发布
该代码实现了一个简单的文件编码检测和内容复制功能。它利用`chardet`库来检测文件的编码,然后将源文件的内容读取并写入新的文件中,保持原始编码。主要适用于处理不同编码格式的文本文件。
4542

被折叠的 条评论
为什么被折叠?



