首先,这片文章纯粹是我的个人经验之谈,适用于我常见的环境及项目中.
个人建议,数据库字符集尽量使用utf8(HTML页面对应的是utf-8),以使你的数据能很顺利的实现迁移,因为utf8字符集是目前最适合于实现多种不同字符集之间的转换的字符集,尽管你在命令行工具上可能无法正确查看数据库中的内容,我依然强烈建议使用utf8作为默认字符集.
接下来是完整的一个例子:
1.创建数据库表
mysql>CreateDATABASEIFNOTEXISTSmy_dbdefaultcharsetutf8COLLATEutf8_general_ci;
#注意后面这句话"COLLATEutf8_general_ci",大致意思是在排序时根据utf8校验集来排序
#那么在这个数据库下创建的所有数据表的默认字符集都会是utf8了
mysql>createtablemy_table(namevarchar(20)notnulldefault'')type=myisamdefaultcharsetutf8;
#这句话就是创建一个表了,制定默认字符集为utf8
2.写数据
例子1是通过php直接插入数据:
a.php
<?php
mysql_connect('localhost','user','password');
mysql_select_db('my_db');
//请注意,这步很关键,如果没有这步,所有的数据读写都会不正确的
//它的作用是设置本次数据库联接过程中,数据传输的默认字符集
//其他编程语言/接口也类似,例如.net/c#/odbc
//jdbc则设置连接字符串为类似"jdbc:mysql://localhost/db?user=user&password=123456&useUnicode=true&characterEncoding=UTF-8"
mysql_query("setnamesutf8;");
//必须将gb2312(本地编码)转换成utf-8,也可以使用iconv()函数
mysql_query(mb_convet_encoding("insertintomy_tablevalues('测试');","utf-8","gb2312"));
?>
例子是通过页面提交插入数据2:
b.php
<?php
//输出本页编码为utf-8
header("content-type:text/html;charset=utf-8");
mysql_connect('localhost','user','password');
mysql_select_db('my_db');
mysql_query("setnamesutf8;");
if(isset($_REQUEST['name'))
{
//由于上面已经指定本页字符集为utf-8了,因此无需转换编码
mysql_query(sprintf("insertintomy_tablevalues('%s');",$_REQUEST['name']));
}
$q=mysql_query("select*frommy_table");
while($r=mysql_fetch_row($q))
{
print_r($r);
}
?>
<metahttp-equiv="Content-Type"content="text/html;charset=utf-8">
<formaction=""method="post">
<inputtype="text"name="name"value="">
<inputtype="submit"value='submit'>
</form>
自此,使用utf8字符集的完整的例子结束了.
如果你想使用gb2312编码,那么建议你使用latin1作为数据表的默认字符集,这样就能直接用中文在命令行工具中插入数据,并且可以直接显示出来.而不要使用gb2312或者gbk等字符集,如果担心查询排序等问题,可以使用binary属性约束,例如:
createtablemy_table(namevarchar(20)binarynotnulldefault'')type=myisamdefaultcharsetlatin1;
附1:旧数据升级办法
以原来的字符集为latin1为例,升级成为utf8的字符集。原来的表:old_table(defaultcharset=latin1),新表:new_table(defaultcharset=utf8)。
第一步:导出旧数据
mysqldump--default-character-set=latin1-hlocalhost-uroot-Bmy_db--tablesold_table>old.sql
第二步:转换编码(类似unix/linux环境下)
iconv-tutf-8-fgb2312-cold.sql>new.sql
或者可以去掉-f参数,让iconv自动判断原来的字符集
iconv-tutf-8-cold.sql>new.sql
在这里,假定原来的数据默认是gb2312编码。
第三步:导入
修改old.sql,在插入/更新语句开始之前,增加一条sql语句:
"SETNAMESutf8;",保存。
mysql-hlocalhost-urootmy_db<new.sql
大功告成!!
附2:支持查看utf8字符集的MySQL客户端有
1.)MySQL-Front,据说这个项目已经被MySQLAB勒令停止了,不知为何,如果国内还有不少破解版可以下载(不代表我推荐使用破解版:-P)。
2.)Navicat,另一款非常不错的MySQL客户端,汉化版刚出来,还邀请我试用过,总的来说还是不错的,不过也需要付费。
3.)PhpMyAdmin,开源的php项目,非常好。
4.)Linux下的终端工具(Linuxterminal),把终端的字符集设置为utf8,连接到MySQL之后,执行SETNAMESUTF8;也能读写utf8数据了。
个人建议,数据库字符集尽量使用utf8(HTML页面对应的是utf-8),以使你的数据能很顺利的实现迁移,因为utf8字符集是目前最适合于实现多种不同字符集之间的转换的字符集,尽管你在命令行工具上可能无法正确查看数据库中的内容,我依然强烈建议使用utf8作为默认字符集.
接下来是完整的一个例子:
1.创建数据库表
mysql>CreateDATABASEIFNOTEXISTSmy_dbdefaultcharsetutf8COLLATEutf8_general_ci;
#注意后面这句话"COLLATEutf8_general_ci",大致意思是在排序时根据utf8校验集来排序
#那么在这个数据库下创建的所有数据表的默认字符集都会是utf8了
mysql>createtablemy_table(namevarchar(20)notnulldefault'')type=myisamdefaultcharsetutf8;
#这句话就是创建一个表了,制定默认字符集为utf8
2.写数据
例子1是通过php直接插入数据:
a.php
<?php
mysql_connect('localhost','user','password');
mysql_select_db('my_db');
//请注意,这步很关键,如果没有这步,所有的数据读写都会不正确的
//它的作用是设置本次数据库联接过程中,数据传输的默认字符集
//其他编程语言/接口也类似,例如.net/c#/odbc
//jdbc则设置连接字符串为类似"jdbc:mysql://localhost/db?user=user&password=123456&useUnicode=true&characterEncoding=UTF-8"
mysql_query("setnamesutf8;");
//必须将gb2312(本地编码)转换成utf-8,也可以使用iconv()函数
mysql_query(mb_convet_encoding("insertintomy_tablevalues('测试');","utf-8","gb2312"));
?>
例子是通过页面提交插入数据2:
b.php
<?php
//输出本页编码为utf-8
header("content-type:text/html;charset=utf-8");
mysql_connect('localhost','user','password');
mysql_select_db('my_db');
mysql_query("setnamesutf8;");
if(isset($_REQUEST['name'))
{
//由于上面已经指定本页字符集为utf-8了,因此无需转换编码
mysql_query(sprintf("insertintomy_tablevalues('%s');",$_REQUEST['name']));
}
$q=mysql_query("select*frommy_table");
while($r=mysql_fetch_row($q))
{
print_r($r);
}
?>
<metahttp-equiv="Content-Type"content="text/html;charset=utf-8">
<formaction=""method="post">
<inputtype="text"name="name"value="">
<inputtype="submit"value='submit'>
</form>
自此,使用utf8字符集的完整的例子结束了.
如果你想使用gb2312编码,那么建议你使用latin1作为数据表的默认字符集,这样就能直接用中文在命令行工具中插入数据,并且可以直接显示出来.而不要使用gb2312或者gbk等字符集,如果担心查询排序等问题,可以使用binary属性约束,例如:
createtablemy_table(namevarchar(20)binarynotnulldefault'')type=myisamdefaultcharsetlatin1;
附1:旧数据升级办法
以原来的字符集为latin1为例,升级成为utf8的字符集。原来的表:old_table(defaultcharset=latin1),新表:new_table(defaultcharset=utf8)。
第一步:导出旧数据
mysqldump--default-character-set=latin1-hlocalhost-uroot-Bmy_db--tablesold_table>old.sql
第二步:转换编码(类似unix/linux环境下)
iconv-tutf-8-fgb2312-cold.sql>new.sql
或者可以去掉-f参数,让iconv自动判断原来的字符集
iconv-tutf-8-cold.sql>new.sql
在这里,假定原来的数据默认是gb2312编码。
第三步:导入
修改old.sql,在插入/更新语句开始之前,增加一条sql语句:
"SETNAMESutf8;",保存。
mysql-hlocalhost-urootmy_db<new.sql
大功告成!!
附2:支持查看utf8字符集的MySQL客户端有
1.)MySQL-Front,据说这个项目已经被MySQLAB勒令停止了,不知为何,如果国内还有不少破解版可以下载(不代表我推荐使用破解版:-P)。
2.)Navicat,另一款非常不错的MySQL客户端,汉化版刚出来,还邀请我试用过,总的来说还是不错的,不过也需要付费。
3.)PhpMyAdmin,开源的php项目,非常好。
4.)Linux下的终端工具(Linuxterminal),把终端的字符集设置为utf8,连接到MySQL之后,执行SETNAMESUTF8;也能读写utf8数据了。