如何正确地获取并转换文本文件的编码

本文介绍了作者在处理utf8和ascii混合编码的.h及.cpp文件时,遇到的批量转换问题。尝试使用Qt和C#进行转换失败后,最终通过Python成功实现了正确识别和转换编码的解决方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

因为实际中需要将很多utf8、ascii混杂编码的.h和.cpp文件,批量转换成ascii编码的文件。
在网上搜索了很多批量转换工具,发现都不能正确转换。
后来,只好自己写一个批量转换工具。

Qt:
一开始想用Qt来开发,也网上查阅很多别人写出来的转换代码。
于是,便用Qt写了一个界面,然后套上去,结果悲剧了,全部识别为UTF-8的。
后来又改了几次,都没有成功,只好放弃。

在这里插入图片描述
C#:
改用了C#试了下,结果一样,也是无法正确识别。它的识别结果和Qt是一样的,原理也是判断开始的几个字节码来识别。我用二进制编辑器打开文件来看,发现ascii和utf8编码的文件,都没有起始字节码区分,都是一样。

在这里插入图片描述
Py:
最后实在没办法了,只好转向py试试。网上找到有人发的转换代码,然后试了下,发现真的可行,可以准确识别出来。

在这里插入图片描述
然后参考他们的代码,自己整理了完整的识别和转换代码。
需要转换其他编码根式的,可以自行修改一下py文件即可。

import codecs
import os

# 待搜索的目录路径
path = r"E:\HDW\kop\FileCodeTransTool\GameServer2"

# 需要转换文件的后缀名
convertfiletypes = [
    ".h",
    ".cpp"
]

# 检测文件是否需要转换
def check_need_convert(filename):
    for filetype in convertfiletypes:
        if filename.lower().endswith(filetype)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

XINGTECODE

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值