MySQL 语法规则以及字符集

最新推荐文章于 2024-07-19 20:29:43 发布

原创最新推荐文章于 2024-07-19 20:29:43 发布 · 548 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#mysql #语法规则 #字符集

MySQL 专栏收录该内容

18 篇文章

订阅专栏

本文介绍了MySQL中字符集的支持机制及其配置方法，包括不同层级的字符集设定、排序规则的应用，以及如何查看和管理字符集与排序规则。

MySQL 标识符语法 & 命名规则

在引用数据库的元素时，标识符必须遵守以下规则：
1、标识符里的合法字符；
2、MySQL 服务器的 SQL 模式；
3、标识符的长度；
4、标识符限定符。

MySQL 语句中的字母大小写问题

SQL 关键字和函数名：不区分
数据库、数据表和视图的名字：Windows 和 Mac OS X 平台不区分、Unix 平台区分。
存储程序的名字：不区分。但是触发器的名字要区分字母大小写。
列名和索引名：不区分。
别名的名字：默认情况下，不区分。
字符串值：取决于是否为二进制，而非二进制字符串还要取决于字符集的排序方式（校验规则）。

不管系统是否区分大小写，都使用一致的大小写组合来使用。

字符集支持

MySQL 的字符集支持机制提供了以下一些功能：
* MySQL 服务器允许同时使用多种字符集。
* 一种给定的字符集可以有一种或多种排序方式（校验规则）。
* 支持 Unicode 的字符集有：utf8 和 ucs2 字符集、utf116、utf32 和 utf8mb4 字符集，以及 utf16le。
* 你可以在服务器、数据库、数据表、数据列和字符串常数等级别设定字符集；
* 既有用来转换数据值的字符集的函数和操作符，也有用来判断数据值的字符集的函数和操作符。
* SHOW 语句和 INFORMATION_SCHEMA 数据表提供了关于可用字符集合排序方式（校验规则）的信息。
* 当你改变某个带索引的字符类型的数据列时，MySQL 服务器将自动地对索引进行重新排序。

字符集的设定

-- 在创建**数据库**时，设置一个默认的字符集和排序方式（校对规则）
CREATE DATABASE db_name CHARACTER SET charset COLLATE collation;
-- 如果想为某个**数据表**设定默认的字符集和排序方式（校对规则），如果没有设定，则使用数据库级别的默认设置。
CREATE TABLE tbl_name(...) CHARACTER SET charset COLLATE collation;
-- 对于数据表里的某个**数据列**，可以使用 CHARACTER 和 COLLATION 属性为它指定一个字符集和排序方式（校对规则），如果没有设定，则使用数据表级别的默认设置
c CHAR(10) CHARACTER SET charset COLLATE collation
-- 属性适用于 CHAR、VARCHAR、TEXT、ENUM 和 SET 数据类型。

也可以利用 COLLATE 操作符按照特定排序方式对字符串值排序。

SELECT name FROM student ORDER BY name COLLATE utf8_spanish_ci;

查看可供选用的字符集和当前设置

-- 查看 mysql 服务器支持的字符集
SHOW CHARACTER SET;
SHOW CHARACTER SET LIKE 'latin%';
SELECT * FROM information_schema.character_sets;

-- 查看字符集的校对规则
SHOW COLLATION;
SHOW COLLATION like 'utf8%';
select * from information_schema.collations where collation_name like 'utf8%';

-- 查看当前数据库的字符集
show variables like 'character%';
-- character_set_client：客户端请求数据的字符集
-- character_set_connection：客户机/服务器连接的字符集
-- character_set_database：默认数据库的字符集，无论默认数据库如何改变，都是这个字符集；如果没有默认数据库，那就使用 character_set_server 指定的字符集，这个变量建议由系统自己管理，不要人为定义。
-- character_set_filesystem：把 os 上文件名转化成此字符集，即把 character_set_client 转换 character_set_filesystem， 默认 binary 是不做任何转换的
-- character_set_results：结果集，返回给客户端的字符集
-- character_set_server：数据库服务器的默认字符集
-- character_set_system：系统字符集，这个值总是 utf8，不需要设置。这个字符集用于数据库对象（如表和列）的名字，也用于存储在目录表中的函数的名字。

-- 查看当前数据库的校对规则
show variables like 'collation%';
-- collation_connection 当前连接的字符集。
-- collation_database 当前日期的默认校对。每次用 USE 语句来“跳转”到另一个数据库的时候，这个变量的值就会改变。如果没有当前数据库，这个变量的值就是 collation_server 变量的值。
-- collation_server 服务器的默认校对
-- 排序方式的命名规则为：字符集名字_语言_后缀，其中各个典型后缀的含义如下：
--  _ci：不区分大小写的排序方式
--  _cs：区分大小写的排序方式
--  _bin：二进制排序方式，大小比较将根据字符编码，不涉及人类语言，因此 _bin 的排序方式不包含人类语言