linux 中文显示菱形和问号乱码 ,在不改变LANG环境变量的情况下怎么处理

在Linux集群环境中,遇到中文项目导入时出现乱码问题,通过使用convmv工具实现文件名编码转换,从GBK转换为UTF-8编码,解决了乱码问题,并提供了详细的命令使用方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

我在集群安装环境时,再导入中文项目是出现乱码:��������;����Ҫ��;????????。由于集群上有很多软件需要LANG=en_US.UTF-8这个环境配置,所以在解决这个问题不能粗暴的改~/.bashrc的环境配置。然后我在找资料的时候发现一个转换格式的方式。经过测试发现很好用,可以分享个大家。

在Linux中专门提供了一种工具convmv进行文件名编码的转换,可以将文件名从GBK转换成UTF-8编码,或者从UTF-8转换到GBK,而我的问题就是在从windows下导入项目包时的中文编码是GBK,而linux下的编码格式是UTF-8,所以无论怎么改变LANG的设置都会显示乱码,找到了问题,解决问题就不远了,首先yum install convmv;根据资料convmv的具体用法:
convmv -f 源编码 -t 新编码 [选项] 文件名
常用参数:
-r 递归处理子文件夹
--notest 真正进行操作,请注意在默认情况下是不对文件进行真实操作的,而只是试验。
--list 显示所有支持的编码
--unescap 可以做一下转义,比如把%20变成空格
比如我们有一个GBK编码的文件名,转换成UTF-8编码,命令如下:
convmv -f GBK -t UTF-8 --notest GBK编码的文件名。

如果想要递归替换整个目录下的乱码文件可以使用:

convmv -f GBK -t UTF-8 --notest -r 目录名称

ok,这要就大功告成了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值