我们程序中常见的编码有ASCII码(表示数据有限,只能表示2^8个字符即256个字符),GBK(或GB2312,表示范围比GBK窄),UTF-8(浏览器URL地址表示编码,此编码常常用于数据传输,因为程序中传输都部分都是英文字母,汉字较少),Unicode编码(java内部编码,任何一个字符的Unicode编码都是不变的),iso8859-1编码(最多能表示的字符范围是0-255,应用于英文系列,很显然它和计算机内部表示AscII码表示一致,再加上历史原因,很多协议都采用此编码,如我们常用Web服务器TOMCAT默认内部编码就是该编码)。
解码:将字符串转化为字节 使用的函数是:getBytes(charset)
编码:将字节转化为字符串 适用的函数是:new String(charset)
本文介绍了程序中常用的几种编码格式,包括ASCII、GBK、UTF-8、Unicode和iso8859-1等,并解释了它们的特点及应用场景。此外还提到了字符串与字节之间的转换方法。

被折叠的 条评论
为什么被折叠?



