JAVA与Unicode(吐血整理)

Unicode是一种字符编码标准,旨在支持多种语言和字符集。它的使用简化了应用程序的本地化,允许单一二进制文件支持多语言。在Java中,Unicode体现在class文件的UTF-16be编码上,确保了跨平台兼容性。JVM处理Unicode提高了程序效率,且Java字符串始终以Unicode存储,确保代码与平台无关。因此,Unicode在Java中的应用对于跨平台编程和国际化至关重要。

什么是Unicode

        Unicode编码是一种计算机字符编码标准,其实个人认为叫字符集更为准确;而我们熟悉的UTF-8 UTF-16 UTF-32Unicode具体实现(怎么存储在计算机)

为何要用Unicode

1Unicode有利于应用程序的本地化。
2、使用Unicode,只需发布一个二进制(.exeDLL)文件,即可支持所有语言。
3Unicode提升了应用程序的效率,因为代码执行速度更快,占用内存更少。windows内部的一切工作都是使用Unicode字符和字符串来进行的。所以假如我们坚持传入ANSI字符或者字符串,windows就会被迫分配内存,并将ANSI字符或者字符串转换为等价的Unicode形式。
4、使用Unicode,应用程序能轻松调用所有尚未弃用的windows函数,因为一些windows函数提供的版本只能处理Unicode字符和字符串。
5、使用Unicode,能保证应用程序的代码能够轻松地操控我们自己的资源(其中的字符串总是Unicode形式的)
        总结:
        也就是说直接使用Unicode可以省略系统进行编码转换的过程,从而提高程序性能
        Unicode的优势主要在于对网络方面,宽字符能够更好的支持跨平台数据传递。

Java文件编译后形成class

        这里Java文件的编码可能有多种多样,但Java编译器会自动将这些编码按照Java文件的编码格式正确读取后产生class文件这里的class文件编码是Unicode编码(具体说是UTF-16be编码)。
        因此,在Java代码中定义一个字符串:
        String s="汉字";
        不管在编译前java文件使用何种编码,在编译后成class后,他们都是一样的----Unicode编码表示。JVM里面的任何字符串资源都是Unicode,就是说,任何String类型的数据都是Unicode编码。

JVM

        JVM加载class文件读取时候使用Unicode编码方式正确读取class文件,那么原来定义的String s="汉字";在内存中的表现形式是Unicode编码。
        与此同时,值得注意的是:Java程序 通过JVM 才具有跨平台的特性,但JVM本身并不是跨平台的。也就是说,不同操作系统的JVM是不同的,Windows平台的JVM不能用在Linux中,反之亦然。简而言之,也就是说,不同的平台本身有着不同的JVM,是JVM成就了Java的跨平台特性。
Java采用了unicode字符集,使之易于国际化。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值