mysql数据库 uft8_unicode_ci是utf8吗_MySQL 的 utf8_general_ci 和 utf8_unicode_ci 有什么区别,应如何选择?...

本文对比了utf8_unicode_ci及utf8_general_ci两种校对规则的特性,包括字符对照表的完整性、排序准确性及系统效能等方面,为选择合适的字符集提供依据。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

首先就其准确性说,这世界上有无数种文字,除了通用的英文使用我们较熟悉的 A-Z 字符外,还有很多种近似的写法用于法文、德文、俄文等等…

utf8_unicode_ci_a.jpg

光是一个 A 字就有数十种不同表现

为什么不都用同一种 A 呢,几十种多麻烦啊。事实上,它们在所属的文字上都各有意义,可能代表不同的发音,也可能是其他东西。在某些语言上,同一个单词不同发音可能就代表两个意思。

校对规则

utf8_unicode_ci 及 utf8_general_ci 的用途就是对那些看起来不一样的字符进行转换,令我们进行排序比对时更方便准确。

以下面为例,直接看起来是不相等的,但在实际应用上是成立的,这就是 utf8_unicode_ci 及 utf8_general_ci 工作的结果。Ä = A

Ö = O

Ü = U

而 utf8_unicode_ci 准确性较好就表现在它有更完整的字元对照表上,它甚至可以将一个特别字符转换成多于一个英文字符,以德文中的 s 例:

在 utf8_unicode_ci 下面等式是成立

ß = ss

在 utf8_general_ci 只有这样才成立

ß = s

排序规则

因为 utf8_unicode_ci 有更完整字符表及转换规则,所以在排序的准确性上也比 utf8_general_ci 高一些。

utf8_general_ci_european.jpg

utf8_general_ci 字符表的一部份

utf8_unicode_ci_european.jpg

utf8_unicode_ci 有更完整的字符表

效能

同样因为 utf8_unicode_ci 的字符表及转换规则更复杂,所以在效能上比 utf8_general_ci 慢。

总结

如果你的应用是德文、俄文等等,或者需要精确处理国际化的内容,请用 utf8_unicode_ci 。

否则的话用 utf8_general_ci 就可以了。

备注

虽然说 utf8_unicode_ci 的字集比较完整,但其实还是不全的,所以 MySQL 还提供了很多种其他语言的专用字集,用于特别的本地应用,详细可以看看下面的官网连结

參考

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值