建库字符集选择`utf8mb4` + `utf8mb4_unicode_ci` 组合

最新推荐文章于 2025-04-19 00:41:23 发布

火冠蜂鸟

最新推荐文章于 2025-04-19 00:41:23 发布

阅读量769

点赞数 5

分类专栏： # mysql 文章标签： java

本文链接：https://blog.youkuaiyun.com/weixin_70280523/article/details/146486986

版权

mysql 专栏收录该内容

34 篇文章

订阅专栏

在 MySQL 中创建 UTF-8 编码的数据库时，请直接使用 **`utf8mb4`** 字符集（而非旧版的 `utf8`），这是 MySQL 中真正的 UTF-8 实现。以下是具体操作和注意事项：

---

### 一、创建数据库（2种方式）
#### 1. 基础版（自动选择默认校对规则）
```sql
CREATE DATABASE your_database_name
CHARACTER SET utf8mb4
COLLATE utf8mb4_unicode_ci;
```

#### 2. 精简版（MySQL 8.0+ 默认使用 `utf8mb4`）
```sql
CREATE DATABASE your_database_name;
```

---

### 二、为什么必须选 `utf8mb4`？
- ✅ **完全支持 Unicode**：包含 Emoji 表情符号（如 😊）、生僻汉字、特殊符号等（`utf8` 仅支持 3 字节字符，无法存储 4 字节字符）。
- ✅ **兼容性**：现代 MySQL 版本（5.5.3+）均支持，且是当前标准方案。

---

### 三、校对规则选择（`COLLATE`）
- **`utf8mb4_unicode_ci`**：基于 Unicode 标准排序，准确性高（推荐）。
- **`utf8mb4_general_ci`**：旧式简单排序，速度快但准确性略低（已逐渐淘汰）。

---

### 四、后续使用注意事项
1. **创建表时显式指定字符集**（避免继承服务器默认配置）：
```sql
CREATE TABLE your_table (
id INT PRIMARY KEY,
content VARCHAR(255)
) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
```

2. **连接字符串配置**（确保应用层与数据库编码一致）：
- JDBC 示例：`jdbc:mysql://host/db?useUnicode=true&characterEncoding=UTF-8`
- 其他语言同理，需明确指定 UTF-8 编码。

---

### 五、验证设置是否生效
```sql
-- 查看数据库编码
SELECT SCHEMA_NAME, DEFAULT_CHARACTER_SET_NAME, DEFAULT_COLLATION_NAME
FROM INFORMATION_SCHEMA.SCHEMATA
WHERE SCHEMA_NAME = 'your_database_name';

-- 查看表编码
SHOW CREATE TABLE your_table;
```

---

**总结**：直接使用 `utf8mb4` + `utf8mb4_unicode_ci` 组合，确保全面兼容 Unicode 并避免未来编码问题。