MySQL 语法规则以及字符集

本文介绍了MySQL中字符集的支持机制及其配置方法,包括不同层级的字符集设定、排序规则的应用,以及如何查看和管理字符集与排序规则。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

MySQL 标识符语法 & 命名规则

在引用数据库的元素时,标识符必须遵守以下规则:
1、标识符里的合法字符
2、MySQL 服务器的 SQL 模式
3、标识符的长度
4、标识符限定符

MySQL 语句中的字母大小写问题
  • SQL 关键字和函数名:不区分
  • 数据库、数据表和视图的名字:Windows 和 Mac OS X 平台不区分、Unix 平台区分。
  • 存储程序的名字:不区分。但是触发器的名字要区分字母大小写。
  • 列名和索引名:不区分。
  • 别名的名字:默认情况下,不区分。
  • 字符串值:取决于是否为二进制,而非二进制字符串还要取决于字符集的排序方式(校验规则)。

不管系统是否区分大小写,都使用一致的大小写组合来使用。

字符集支持

MySQL 的字符集支持机制提供了以下一些功能:
* MySQL 服务器允许同时使用多种字符集
* 一种给定的字符集可以有一种或多种排序方式(校验规则)
* 支持 Unicode 的字符集有:utf8 和 ucs2 字符集utf116、utf32 和 utf8mb4 字符集,以及 utf16le
* 你可以在服务器、数据库、数据表、数据列和字符串常数等级别设定字符集;
* 既有用来转换数据值的字符集的函数和操作符,也有用来判断数据值的字符集的函数和操作符。
* SHOW 语句和 INFORMATION_SCHEMA 数据表提供了关于可用字符集合排序方式(校验规则)的信息。
* 当你改变某个带索引的字符类型的数据列时,MySQL 服务器将自动地对索引进行重新排序

字符集的设定

-- 在创建**数据库**时,设置一个默认的字符集和排序方式(校对规则)
CREATE DATABASE db_name CHARACTER SET charset COLLATE collation;
-- 如果想为某个**数据表**设定默认的字符集和排序方式(校对规则),如果没有设定,则使用数据库级别的默认设置。
CREATE TABLE tbl_name(...) CHARACTER SET charset COLLATE collation;
-- 对于数据表里的某个**数据列**,可以使用 CHARACTER 和 COLLATION 属性为它指定一个字符集和排序方式(校对规则),如果没有设定,则使用数据表级别的默认设置
c CHAR(10) CHARACTER SET charset COLLATE collation
-- 属性适用于 CHARVARCHAR、TEXT、ENUM 和 SET 数据类型。

也可以利用 COLLATE 操作符按照特定排序方式对字符串值排序

SELECT name FROM student ORDER BY name COLLATE utf8_spanish_ci;

查看可供选用的字符集和当前设置

-- 查看 mysql 服务器支持的字符集
SHOW CHARACTER SET;
SHOW CHARACTER SET LIKE 'latin%';
SELECT * FROM information_schema.character_sets;

-- 查看字符集的校对规则
SHOW COLLATION;
SHOW COLLATION like 'utf8%';
select * from information_schema.collations where collation_name like 'utf8%';

-- 查看当前数据库的字符集
show variables like 'character%';
-- character_set_client:客户端请求数据的字符集
-- character_set_connection:客户机/服务器连接的字符集
-- character_set_database:默认数据库的字符集,无论默认数据库如何改变,都是这个字符集;如果没有默认数据库,那就使用 character_set_server 指定的字符集,这个变量建议由系统自己管理,不要人为定义。
-- character_set_filesystem:把 os 上文件名转化成此字符集,即把 character_set_client 转换 character_set_filesystem, 默认 binary 是不做任何转换的
-- character_set_results:结果集,返回给客户端的字符集
-- character_set_server:数据库服务器的默认字符集
-- character_set_system:系统字符集,这个值总是 utf8,不需要设置。这个字符集用于数据库对象(如表和列)的名字,也用于存储在目录表中的函数的名字。

-- 查看当前数据库的校对规则
show variables like 'collation%';
-- collation_connection 当前连接的字符集。
-- collation_database 当前日期的默认校对。每次用 USE 语句来“跳转”到另一个数据库的时候,这个变量的值就会改变。如果没有当前数据库,这个变量的值就是 collation_server 变量的值。
-- collation_server 服务器的默认校对
-- 排序方式的命名规则为:字符集名字_语言_后缀,其中各个典型后缀的含义如下:
--  _ci:不区分大小写的排序方式
--  _cs:区分大小写的排序方式
--  _bin:二进制排序方式,大小比较将根据字符编码,不涉及人类语言,因此 _bin 的排序方式不包含人类语言
### 创建具有特定字符集和排序规则的 MySQL 数据库 在 MySQL 中,可以通过 `CREATE DATABASE` 语句来创建一个新的数据库,并为其指定默认的字符集 (character set) 和排序规则 (collation)[^2]。以下是实现这一功能的具体方法: #### 使用 CREATE DATABASE 的语法 要创建一个带有特定字符集和排序规则的数据库,可以按照以下语法执行操作: ```sql CREATE DATABASE IF NOT EXISTS db_name DEFAULT CHARACTER SET charset_name DEFAULT COLLATE collation_name; ``` - **db_name**: 要创建的数据库名称。 - **charset_name**: 指定该数据库使用的字符集,例如 `utf8mb4` 或者其他支持的字符集。 - **collation_name**: 定义字符串比较的方式,通常与选定的字符集相匹配。对于 `utf8mb4` 字符集,常见的排序规则是 `utf8mb4_general_ci` 或 `utf8mb4_unicode_ci`。 #### 示例代码 下面是一个具体的例子,展示如何创建一个名为 `my_database` 的新数据库,并设置其默认字符集为 `utf8mb4`,以及对应的排序规则为 `utf8mb4_unicode_ci`: ```sql CREATE DATABASE IF NOT EXISTS my_database DEFAULT CHARACTER SET utf8mb4 DEFAULT COLLATE utf8mb4_unicode_ci; ``` 此命令会确保新建的数据库始终使用 UTF-8 编码及其推荐的 Unicode 排序方式。 当查询返回结果时,服务器将依据 `character_set_results` 变量决定采用何种字符集编码处理这些数据[^3];而对于简单的 SQL 查询(如 `SELECT 'string'`),则依赖于连接级别的默认字符集设定 (`character_set_connection`) 来定义字符串的实际编码属性[^4]。 通过上述配置过程,能够有效管理存储于数据库中的文本信息的语言特性和兼容程度。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值