Mysql查看编码方式专题
一、查看数据库的字符集
show variables like 'character\_set\_%';
输出:
+--------------------------+--------+
| Variable_name | Value |
+--------------------------+--------+
| character_set_client | latin1 |
| character_set_connection | latin1 |
| character_set_database | latin1 |
| character_set_filesystem | binary |
| character_set_results | latin1 |
| character_set_server | latin1 |
| character_set_system | utf8 |
+--------------------------+--------+
结合以下的编码表我们发现当前的数据库系统的编码:
以上是我在linux环境中的查看的结果编码集了。我现在WIN平台上面查看编码集结果如:
+--------------------------+--------+
| Variable_name | Value |
+--------------------------+--------+
| character_set_client | utf8 |
| character_set_connection | utf8 |
| character_set_database | utf8 |
| character_set_filesystem | binary |
| character_set_results | utf8 |
| character_set_server | utf8 |
| character_set_system | utf8 |
+--------------------------+--------+
为什么会出现不一致的情况呢?在我本机上面是显示的UTF-8.而在LINUX上面居然是
二、通过命令修改其编码
创建数据库指定数据库的字符集
mysql>create database mydb character set utf-8;#直接指定其编码
直接通过命令进行修改
set character_set_client=utf8;
set character_set_connection=utf8;
set character_set_database=utf8;
set character_set_results=utf8;
set character_set_server=utf8;
修改完了之后再查询
show variables like 'character\_set\_%';
+--------------------------+--------+
| Variable_name | Value |
+--------------------------+--------+
| character_set_client | utf8 |
| character_set_connection | utf8 |
| character_set_database | utf8 |
| character_set_filesystem | binary |
| character_set_results | utf8 |
| character_set_server | utf8 |
| character_set_system | utf8 |
+--------------------------+--------+
结果全部都调整修改成UTF-8了!
修改完了之后我看 select * from address_address; 出现乱码了!Django也乱码
三、解决数据导入导出的乱码问题
#create database nginxdjango;
# use nginxdjango;
# show variables like 'character\_set\_%';
#打印输出居然是如下
+--------------------------+--------+
| Variable_name | Value |
+--------------------------+--------+
| character_set_client | latin1 |
| character_set_connection | latin1 |
| character_set_database | latin1 |
| character_set_filesystem | binary |
| character_set_results | latin1 |
| character_set_server | latin1 |
| character_set_system | utf8 |
+--------------------------+--------+
依旧是latin编码的。
OK。我将其编码设置一下
set character_set_client=utf8;
set character_set_connection=utf8;
set character_set_database=utf8;
set character_set_results=utf8;
set character_set_server=utf8;
再查询一下其编码格式为:
+--------------------------+--------+
| Variable_name | Value |
+--------------------------+--------+
| character_set_client | utf8 |
| character_set_connection | utf8 |
| character_set_database | utf8 |
| character_set_filesystem | binary |
| character_set_results | utf8 |
| character_set_server | utf8 |
| character_set_system | utf8 |
+--------------------------+--------+
现在将数据导进来
source /python/django/sql/nginxdjango.sql;
其中的 nginxdjango.sql 其编码也是utf-8 格式的!
导进来 数据库查看居然还是乱码不过程序跑起来是正常了!
MySQL字符集编码的类型种类
gb2312_chinese_ci和gbk_chinese_ci以及gb2312_bin,gbk_bin的区别
gb2312_chinese_CI : 只支持简体中文
gb2312_BIN :而gb2312_bin可以说是gb2312_chinese_ci的一个子集,
而且gb2312_BIN是二进制存储.区分大小写数据库编码格式就意义不一样了
gbk_chinese_CI 支持简体中文和繁体
gbk_bin 解释同gb2312_BIN 对应gbk_chinese_CI
PS:GBK包括了简体与繁体两种类型
附表:
mysql字符集和整理列表
armscii8 (ARMSCII-8 Armenian)
|
armscii8_bin
|
亚美尼亚语, 二进制
|
armscii8_general_ci
|
亚美尼亚语, 不区分大小写
|
ascii (US ASCII)
|
ascii_bin
|
西欧 (多语言), 二进制
|
ascii_general_ci
|
西欧 (多语言), 不区分大小写
|
big5 (Big5 Traditional Chinese)
|
big5_bin
|
繁体中文, 二进制
|
big5_chinese_ci
|
繁体中文, 不区分大小写
|
binary (Binary pseudo charset)
|
binary
|
二进制
|
cp1250 (Windows Central European)
|
cp1250_bin
|
中欧 (多语言), 二进制
|
cp1250_croatian_ci
|
克罗地亚语, 不区分大小写
|
cp1250_czech_cs
|
捷克语, 区分大小写
|
cp1250_general_ci
|
中欧 (多语言), 不区分大小写
|
cp1251 (Windows Cyrillic)
|
cp1251_bin
|
西里尔语 (多语言), 二进制
|
cp1251_bulgarian_ci
|
保加利亚语, 不区分大小写
|
cp1251_general_ci
|
西里尔语 (多语言), 不区分大小写
|
cp1251_general_cs
|
西里尔语 (多语言), 区分大小写
|
cp1251_ukrainian_ci
|
乌克兰语, 不区分大小写
|
cp1256 (Windows Arabic)
|
cp1256_bin
|
阿拉伯语, 二进制
|
cp1256_general_ci
|
阿拉伯语, 不区分大小写
|
cp1257 (Windows Baltic)
|
cp1257_bin
|
巴拉克语 (多语言), 二进制
|
cp1257_general_ci
|
巴拉克语 (多语言), 不区分大小写
|
cp1257_lithuanian_ci
|
立陶宛语, 不区分大小写
|
cp850 (DOS West European)
|
cp850_bin
|
西欧 (多语言), 二进制
|
cp850_general_ci
|
西欧 (多语言), 不区分大小写
|
cp852 (DOS Central European)
|
cp852_bin
|
中欧 (多语言), 二进制
|
cp852_general_ci
|
中欧 (多语言), 不区分大小写
|
cp866 (DOS Russian)
|
cp866_bin
|
俄语, 二进制
|
cp866_general_ci
|
俄语, 不区分大小写
|
cp932 (SJIS for Windows Japanese)
|
cp932_bin
|
日语, 二进制
|
cp932_japanese_ci
|
日语, 不区分大小写
|
dec8 (DEC West European)
|
dec8_bin
|
西欧 (多语言), 二进制
|
dec8_swedish_ci
|
瑞典语, 不区分大小写
|
euckr (EUC-KR Korean)
|
euckr_bin
|
朝鲜语, 二进制
|
euckr_korean_ci
|
朝鲜语, 不区分大小写
|
gb2312 (GB2312 Simplified Chinese)
|
gb2312_bin
|
简体中文, 二进制
|
gb2312_chinese_ci
|
简体中文, 不区分大小写
|
gbk (GBK Simplified Chinese)
|
gbk_bin
|
简体中文, 二进制
|
gbk_chinese_ci
|
简体中文, 不区分大小写
|
geostd8 (GEOSTD8 Georgian)
|
geostd8_bin
|
乔治亚语, 二进制
|
geostd8_general_ci
|
乔治亚语, 不区分大小写
|
greek (ISO 8859-7 Greek)
|
greek_bin
|
希腊语, 二进制
|
greek_general_ci
|
希腊语, 不区分大小写
|
hebrew (ISO 8859-8 Hebrew)
|
hebrew_bin
|
希伯来语, 二进制
|
hebrew_general_ci
|
希伯来语, 不区分大小写
|
hp8 (HP West European)
|
hp8_bin
|
西欧 (多语言), 二进制
|
hp8_english_ci
|
英语, 不区分大小写
|
keybcs2 (DOS Kamenicky Czech-Slovak)
|
keybcs2_bin
|
捷克斯洛伐克语, 二进制
|
keybcs2_general_ci
|
捷克斯洛伐克语, 不区分大小写
|
koi8r (KOI8-R Relcom Russian)
|
koi8r_bin
|
俄语, 二进制
|
koi8r_general_ci
|
俄语, 不区分大小写
|
koi8u (KOI8-U Ukrainian)
|
koi8u_bin
|
乌克兰语, 二进制
|
koi8u_general_ci
|
乌克兰语, 不区分大小写
|
latin1 (cp1252 West European)
|
latin1_bin
|
西欧 (多语言), 二进制
|
latin1_danish_ci
|
丹麦语, 不区分大小写
|
latin1_general_ci
|
西欧 (多语言), 不区分大小写
|
latin1_general_cs
|
西欧 (多语言), 区分大小写
|
latin1_german1_ci
|
德语 (字典), 不区分大小写
|
latin1_german2_ci
|
德语 (电话本), 不区分大小写
|
latin1_spanish_ci
|
西班牙语, 不区分大小写
|
latin1_swedish_ci
|
瑞典语, 不区分大小写
|
|
latin2 (ISO 8859-2 Central European)
|
latin2_bin
|
中欧 (多语言), 二进制
|
latin2_croatian_ci
|
克罗地亚语, 不区分大小写
|
latin2_czech_cs
|
捷克语, 区分大小写
|
latin2_general_ci
|
中欧 (多语言), 不区分大小写
|
latin2_hungarian_ci
|
匈牙利语, 不区分大小写
|
latin5 (ISO 8859-9 Turkish)
|
latin5_bin
|
土耳其语, 二进制
|
latin5_turkish_ci
|
土耳其语, 不区分大小写
|
latin7 (ISO 8859-13 Baltic)
|
latin7_bin
|
巴拉克语 (多语言), 二进制
|
latin7_estonian_cs
|
爱沙尼亚语, 区分大小写
|
latin7_general_ci
|
巴拉克语 (多语言), 不区分大小写
|
latin7_general_cs
|
巴拉克语 (多语言), 区分大小写
|
macce (Mac Central European)
|
macce_bin
|
中欧 (多语言), 二进制
|
macce_general_ci
|
中欧 (多语言), 不区分大小写
|
macroman (Mac West European)
|
macroman_bin
|
西欧 (多语言), 二进制
|
macroman_general_ci
|
西欧 (多语言), 不区分大小写
|
sjis (Shift-JIS Japanese)
|
sjis_bin
|
日语, 二进制
|
sjis_japanese_ci
|
日语, 不区分大小写
|
swe7 (7bit Swedish)
|
swe7_bin
|
瑞典语, 二进制
|
swe7_swedish_ci
|
瑞典语, 不区分大小写
|
tis620 (TIS620 Thai)
|
tis620_bin
|
泰语, 二进制
|
tis620_thai_ci
|
泰语, 不区分大小写
|
ucs2 (UCS-2 Unicode)
|
ucs2_bin
|
Unicode (多语言), 二进制
|
ucs2_czech_ci
|
捷克语, 不区分大小写
|
ucs2_danish_ci
|
丹麦语, 不区分大小写
|
ucs2_estonian_ci
|
爱沙尼亚语, 不区分大小写
|
ucs2_general_ci
|
Unicode (多语言), 不区分大小写
|
ucs2_icelandic_ci
|
冰岛语, 不区分大小写
|
ucs2_latvian_ci
|
拉脱维亚语, 不区分大小写
|
ucs2_lithuanian_ci
|
立陶宛语, 不区分大小写
|
ucs2_persian_ci
|
波斯语, 不区分大小写
|
ucs2_polish_ci
|
波兰语, 不区分大小写
|
ucs2_roman_ci
|
西欧, 不区分大小写
|
ucs2_romanian_ci
|
罗马尼亚语, 不区分大小写
|
ucs2_slovak_ci
|
斯洛伐克语, 不区分大小写
|
ucs2_slovenian_ci
|
斯洛文尼亚语, 不区分大小写
|
ucs2_spanish2_ci
|
传统西班牙语, 不区分大小写
|
ucs2_spanish_ci
|
西班牙语, 不区分大小写
|
ucs2_swedish_ci
|
瑞典语, 不区分大小写
|
ucs2_turkish_ci
|
土耳其语, 不区分大小写
|
ucs2_unicode_ci
|
Unicode (多语言), 不区分大小写
|
ujis (EUC-JP Japanese)
|
ujis_bin
|
日语, 二进制
|
ujis_japanese_ci
|
日语, 不区分大小写
|
utf8 (UTF-8 Unicode)
|
utf8_bin
|
Unicode (多语言), 二进制
|
utf8_czech_ci
|
捷克语, 不区分大小写
|
utf8_danish_ci
|
丹麦语, 不区分大小写
|
utf8_estonian_ci
|
爱沙尼亚语, 不区分大小写
|
utf8_general_ci
|
Unicode (多语言), 不区分大小写[查看列编码常看到这样的编码格式的!]
|
utf8_icelandic_ci
|
冰岛语, 不区分大小写
|
utf8_latvian_ci
|
拉脱维亚语, 不区分大小写
|
utf8_lithuanian_ci
|
立陶宛语, 不区分大小写
|
utf8_persian_ci
|
波斯语, 不区分大小写
|
utf8_polish_ci
|
波兰语, 不区分大小写
|
utf8_roman_ci
|
西欧, 不区分大小写
|
utf8_romanian_ci
|
罗马尼亚语, 不区分大小写
|
utf8_slovak_ci
|
斯洛伐克语, 不区分大小写
|
utf8_slovenian_ci
|
斯洛文尼亚语, 不区分大小写
|
utf8_spanish2_ci
|
传统西班牙语, 不区分大小写
|
utf8_spanish_ci
|
西班牙语, 不区分大小写
|
utf8_swedish_ci
|
瑞典语, 不区分大小写
|
utf8_turkish_ci
|
土耳其语, 不区分大小写
|
utf8_unicode_ci
|
Unicode (多语
|
新篇:2010-03-09
MySQL中默认字符集的设置有四级:服务器级,数据库级,表级 。最终是字段级 的字符集设置。注意前三种均为默认设置,并不代码你的字段最终会使用这个字符集设置。所以我们建议要用show create table table ; 或show full fields from tableName; 来检查当前表中字段的字符集设置。
MySQL中关于连接环境的字符集设置有 Client端,connection, results 通过这些参数,MySQL就知道你的客户端工具用的是什么字符集,结果集应该是什么字符集。这样MySQL就会做必要的翻译,一旦这些参数有误,自然会导致字符串在转输过程中的转换错误。基本上99%的乱码由些造成。
1. 数据库表中字段的字符集设置 。show create table TableName 或 show full columns from tableName
mysql> show create table t1;
mysql> show full columns from t1; 查看列的编码类型
3. 查看数据库的编码格式
show create database test;
输出:CREATE DATABASE `test` /*!40100 DEFAULT CHARACTER SET utf8 */
2. 当前联接系统参数 show variables like 'char%'
mysql> show variables like 'char%';
1. 中文,请确保 表中该字段的字符集为中文兼容:
big5 | Big5 Traditional Chinese
gb2312 | GB2312 Simplified Chinese
gbk | GBK Simplified Chinese
utf8 | UTF-8 Unicode
[其它补充]
修改数据库的字符集
mysql>use mydb
mysql>alter database mydb character set utf-8;
创建数据库指定数据库的字符集
mysql>create database mydb character set utf-8;
|