1. utf8mb4_general_ci vs utf8mb4_bin 的具体区别
utf8mb4_general_ci 和 utf8mb4_bin 都是 utf8mb4 编码的排序规则(collation),它们主要在 排序(ORDER BY) 和 比较(WHERE) 时的行为不同:
| 排序规则 | 是否区分大小写 | 是否区分重音 | 速度 | 适用场景 |
|---|---|---|---|---|
utf8mb4_general_ci |
❌ 不区分 | ❌ 不区分 | ✅ 更快 | 适用于一般文本,如用户名、标题 |
utf8mb4_bin |
✅ 区分 | ✅ 区分 | ⛔ 更慢 | 适用于密码、唯一标识符 |
(1) utf8mb4_general_ci(Case-Insensitive,不区分大小写)
- CI 代表 “Case Insensitive”,表示比较时 不区分大小写,也 不区分重音符号。
- 例如:
SELECT 'a' = 'A'; -- 结果是 TRUE SELECT 'résumé' = 'resume'; -- 结果是 TRUEutf8mb4_general_ci主要适用于 对大小写或重音符号不敏感的文本(如用户名、标签等)。
(2) utf8mb4_bin(Binary,区分大小写)
utf8mb4_bin按照 二进制编码 逐字节进行比较,因此大小写、重音符号完全不同。- 例如:
SELECT 'a' = 'A' COLLATE utf8mb4_bin; -- 结果是 FALSE SELECT 'résumé' = 'resume' COLLATE utf8mb4_bin; -- 结果是 FALSEutf8mb4_bin适用于 严格区分大小写的场景(如密码、文件名、唯一标识符)。
2. 除了 utf8mb4_general_ci 和 utf8mb4_bin,还有哪些?
utf8mb4 编码有多种排序规则,主要区别在于:
- 是否区分大小写
- 是否区分重音
- 排序算法

最低0.47元/天 解锁文章
1212






