漫谈编码与字符集

前言:在日常学习生活中,不断的有人提到utf-8,utf-16,utf-32,和Ascall码,但是大家似乎对这些东西理解的不够透彻,看了一篇公众号的详解后,这里就来谈谈这方面的问题…

  • 编码的概念

首先我们需要明确,计算机只能识别01这样的二进制代码,由01这样的二进制代码到文字的改变我们我们叫做解码,由文字向01转变的过程我们叫做编码。。。–

  • 字符集的概念

字符集就是我们常说的utf-8,utf-16,utf-32,这里面utf是unicode transformation format的缩写,unicode的出现是为了解决各个国家字符不一致的问题,比如刚开始的ascall编码是美国人的字符集,后来中国的GBK,韩国日本都有自己的字符集,后来为了国际统一,就使用了utf字符集,每一个字符都有自己的id号,这个我们也把它叫做码点,而这里utf-32的意思是,是以32位为32位为一个码元,照理推之,utf-16,是以16位为一个码元,utf-8,是以8位为一个码元,由于以32位为一个码元就会占去四个字节,造成空间浪费,所以大部分使用的都是utf-16,和utf-8,比如jvm中使用的即是utf-16.。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值