这是PHP:两个服务器同步数据开发手记的第二篇,主要解决同步数据过程中的中文编码问题,简单说就是在使用JSON encode和decode时GBK和UTF-8之间的编码转换问题。
由于历史遗留问题,数据库表的编码是gbk_general_ci,原来的程序读写数据库时并没有 set names utf8或 set names gbk,而现在要加入同步代码,原先的想法把同步代码写到一个PHP文件中,定时执行,读写数据库时先query一句set names utf8, 但后来发现这个方法弊端太多,实时同步这点无论如何做不到,只好把同步代码嵌入到原有的程序中。但这样一来原来的程序使用的gbk字符集和同步代码使用的utf8字符串相冲突,本地数据和远程数据时常出现乱码。最终的解决方案:原来程序保持不变,同步代码中的中文经过两层转码,一是从数据库中读出的gbk字符集先转成utf8后再encode,远程服务器对utf8编码decode后再转成gbk编码。
用到的函数:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
|
function
cn_json_encode( $value ,
$options = 0)
{
return
json_encode(cn_json_convert_encoding( $value ,
"GBK" , "UTF-8" ));
}
function
cn_json_decode( $str ,
$assoc = false,
$depth = 512) {
return
cn_json_convert_encoding(json_decode( $str ,
$assoc ),
"UTF-8" , "GBK" );
}
function
cn_json_convert_encoding( $m ,
$from , $to )
{
switch ( gettype ( $m ))
{
case
'integer' :
case
'boolean' :
case
'float' :
case
'double' :
case
'NULL' :
return
$m ;
case
'string' :
return
mb_convert_encoding( $m ,
$to , $from );
case
'object' :
$vars
= array_keys (get_object_vars( $m ));
foreach ( $vars
as $key ) {
$m -> $key
= cn_json_convert_encoding( $m -> $key ,
$from , $to );
}
return
$m ;
case
'array' :
foreach ( $m
as $k
=> $v ) {
$m [cn_json_convert_encoding( $k ,
$from , $to )] = cn_json_convert_encoding( $v ,
$from , $to );
}
return
$m ;
default :
}
return
$m ; } |
有了这几个函数,以后就不用为JSON中的中文编码发愁了。