汉字在web应用中不可避免,采用通用的编码方案对于错误避免,开发效率提高,通用性都有好处。
在URL中往往采用UTF8的%AB%2C%0E多字节的编码方式,而在数据域如POST、OK包的数据里,汉字采用\ub1a5之类的6字节明文较多,这一点事实上能带来web开发很多方便。
如果采用json编码,json只能编码utf8编码的字符,并且自动编为Unicode编码,此时采用json_encode($str_utf8)结果就是\ub1a5格式的6字节表示一个汉字的字符串。
对于PHP, 在脚本前面加入 <meta http-equiv="Content-Type" content="text/html; charset=utf8"/> 即表示脚本中出现的汉字一律是utf8编码。