代码中统一使用utf-8编码是最好的,但是有一些多人合作的项目或者一些历史遗留代码,常见一些中文注释乱码的问题。这里以一个开源项目evpp为例子 evpp。以项目中的一个commit id为例: 477033f938fd47dfecde43c82257cd286d9fa38e , git checkout -b test 477033f938fd47dfecde43c82257cd286d9fa38e , 切换一个分支用于测试。这个项目中的 evpp/logging.h 文件的注释就存在乱码。本人用vscode打开的截图如下:

当然这种情况在网页上或者notepad++上有的可以看清楚乱码的注释。但是这没有解决根本问题,编码混乱还是存在。如果代码中这种情况比较少,手动修改一下也是可以的,文件比较多就比较痛苦了。如下的perl脚本用于解决这个问题。
#! /usr/bin/perl
use v5.14;
use Tie::File;
use Encode

代码统一用utf - 8编码,但多人合作或遗留代码常出现中文注释乱码。以开源项目evpp为例,其evpp/logging.h文件注释存在乱码。手动修改文件多会很痛苦,可使用perl脚本process_comments.pl解决,执行后乱码注释能正常显示。
最低0.47元/天 解锁文章
1307

被折叠的 条评论
为什么被折叠?



