关于中文乱码的总结

本文解析了CMD(命令提示符)在默认情况下采用GBK编码格式的原因,以及它在处理中文字符时的作用,探讨了编码选择对IT操作的影响。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

cmd默认使用GBK编码格式

字符编码流程

转载【转】【编码】准确设置-Dfile.encoding参数_IT知识问答_希赛网_-dfileencodings-优快云博客

从Java 源代码到得到正确的结果,要经过 “Java 源代码-> Java 字节码-> 虚拟机->操作系统->显示设备”的过程。在上述过程中的每一步骤,我们都必须正确地处理中文的编码,才能够使最终显示正确的结果。

“Java 源代码-> Java 字节码”:该阶段就是调用javac 进行编译的阶段,javac默认采用系统字符集,比如我们本地机器急就是GBK,如果想用其他的编码,比如UTF-8,可以加上 -encoding UTF-8

“Java 字节码-> 虚拟机->操作系统” :该阶段首先需要JRE或者JDK支持多语言(下载JRE的时候会让你选择英文版还是多语言版),然后就是虚拟机启动的时候使用什么字符集,默认也是采用 当前系统的字符集,如需要修改字符集,加上JAVA的启动参数,-Dfile.encoding=GBK

“操作系统->显示设备”:该阶段主要就是需要操作系统支持显示中文就可以,就是安装了中文字体。

看到这里后重新看我们的乱码问题,我们在本地编译(Java 源代码-> Java 字节码 阶段)默认采用了GBK字符集,而”Java 字节码-> 虚拟机->操作系统” 阶段是在法国服务器上进行,也是采用了默认的字符集,但这里的默认字符集确实Cp1252,因字符集不一致,所以就会乱码。

结合自己:

在本机测试,Java 源代码-> Java 字节码-> 虚拟机->操作系统->显示设备这整个过程都是在GBK环境下进行的,

而使用tomcat 后上述过程就会被拆成两部分进行

1)Java 源代码-> Java 字节码 流程

2) Java 字节码-> 虚拟机->操作系统->显示设备 流程 

这两种流程都必须正确解决中文编码字符集

1)和2)都是会依附于当前开发环境和使用环境系统默认编码集

控制台中文乱码

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值