因为实际中需要将很多utf8、ascii混杂编码的.h和.cpp文件,批量转换成ascii编码的文件。
在网上搜索了很多批量转换工具,发现都不能正确转换。
后来,只好自己写一个批量转换工具。
Qt:
一开始想用Qt来开发,也网上查阅很多别人写出来的转换代码。
于是,便用Qt写了一个界面,然后套上去,结果悲剧了,全部识别为UTF-8的。
后来又改了几次,都没有成功,只好放弃。
C#:
改用了C#试了下,结果一样,也是无法正确识别。它的识别结果和Qt是一样的,原理也是判断开始的几个字节码来识别。我用二进制编辑器打开文件来看,发现ascii和utf8编码的文件,都没有起始字节码区分,都是一样。
Py:
最后实在没办法了,只好转向py试试。网上找到有人发的转换代码,然后试了下,发现真的可行,可以准确识别出来。
然后参考他们的代码,自己整理了完整的识别和转换代码。
需要转换其他编码根式的,可以自行修改一下py文件即可。
import codecs
import os
# 待搜索的目录路径
path = r"E:\HDW\kop\FileCodeTransTool\GameServer2"
# 需要转换文件的后缀名
convertfiletypes = [
".h",
".cpp"
]
# 检测文件是否需要转换
def check_need_convert(filename):
for filetype in convertfiletypes:
if filename.lower().endswith(filetype)