查看当前mysql支持的字符集
show charset [like 'utf8%'];
Charset
:字符集名称
Default_collation
:默认的比较规则
Maxlen
:最大长度,utf8字符长度为1-3所以MaxLen为3 utf8mb4字符长度1-4所以Maxlen为4
查看当前mysql中支持的比较规则
show collation [like 'utf8%'];
Default
:是否是当前字符集默认的比较规则
Complied
:是否将字符集编译到了server中
Sortlen
:与比较字符串在内存中需要的内存量有关
utf8_str1_str2
str1
代表着比较规则所使用的的语言,比如 utf8_polish_xx表示波兰语的比较规则
str2
代表着如何比较.
通常情况下我们会使用的是utf8_general_ci
与utf8_bin
,前者代表着不区分大小写,后者代表着区分大小写
字符集与比较规则的分类
按照应用级别可以分为服务器级别 数据库级别 表级别 列级别
服务器级别
字符集
show variables like 'character_set_server';
默认: utf8
比较规则
show variables like 'collation_server';
默认: utf8_general_ci
数据库级别
show variables like 'character_set_database';
默认: utf8
show variables like 'collation_database';
默认:utf8_general_ci
创建数据库时指定:
create database xxx [character set '字符集名' collate '比较规则名称']
表级别
表级别没有专门变量表示
创建数据表时指定:
create table xxx (xxx) [character set 字符集名 collate 比较规则名称]
列级别
create table xxx (
id int [character set 字符集名称] [collate 比较规则名称]
) [character set 字符集名 collate 比较规则名称]
如果列级别没有设置字符集与比较规则,则使用表的,如果表没有设置,则使用数据库的,如果数据库没有设置则使用服务器的.
mysql通信中的字符集与比较规则
character_set_client(服务端收到请求)
此变量session级
当我们用客户端与服务端通信时,character_set_client
指的是,服务端以什么字符集去理解客户端发送过来的请求,默认是当前操作系统字符集.在当前seesion中,此变量为utf8
,如果设置成gbk
,会导致select '我'
会乱码,因为服务端会把从服务端收到的以utf8编码的’我’使用gbk解码,所以会乱码,.
character_set_connection(服务端处理请求)
此变量session级
当服务器将’我’通过character_set_client正确解码后,会按照character_set_connection进行编码,然后按照collation_connection比较规则进行比较,但是如果查询中有列比如select '我'=name from aaa
此时会优先采用name列的字符集与比较规则进行判断
character_set_results(服务端响应请求)
此变量session级
服务器将要响应的数据以什么格式进行编码,比如select name from aaa
name是以utf8编码的,character_set_results是gbk编码,那么会把查询的结果以gbk编码对客户端响应
客户端接收请求
客户端接收响应的请求后,会以什么编码的方式显示出来,默认就是当前系统的字符集