mysql字符集

这篇文章是自己学习mysql随手写的杂记,编辑混乱且不够严谨,请勿参考,谢谢!

字符集界定能够将哪些字符编码成二进制码,比较规则则是一种比较字符大小的规则。

我们通常遇到的乱码问题,本质是编解码出现了问题。也即是编码和解码字符集不一致导致的。

在mysql中utf8其实是utf8mb3,采用的是1-3个变长字节。而utf8mb4则是采用的1-4个变长字节,如果存储emoji表情,需要使用utf8mb4。在mysql中,字符集分为四个级别:

  • 服务器
  • 数据库

如果低级别的字符集没有显示指定,则采用上一个级别的字符集。

客户端查询的整个编解码过程是:

如果①和②客户端不和服务端保持一致,则会产生问题。character_set_client,character_set_connection,character_set_results可以通过set NAMES 字符集统一设置。也可以放在配置文件中配置。

查看mysql支持的字符集和比较规则

show character

show collation

完。

### MySQL 字符集设置及常见问题 MySQL字符集(Character Set)和排序规则(Collation)是数据库管理中的重要部分,直接影响数据存储、传输以及查询结果的准确性。以下是关于 MySQL 字符集设置及其常见问题的详细说明。 #### 1. 字符集与排序规则的基本概念 字符集定义了数据库如何存储字符数据,而排序规则则定义了字符数据在比较时的行为方式。例如,在字符序 `utf8_general_ci` 下,大小写不敏感,字符 "a" 和 "A" 是等价的[^3]。 #### 2. 字符集支持的层次结构 MySQL字符集支持可以细化到四个层次:服务器(server)、数据库(database)、数据表(table)和连接(connection)。每一层都可以独立设置字符集,但若未显式指定,则会继承上一层的默认值[^2]。 #### 3. 默认字符集的来源 如果在创建数据库或数据表时未明确指定字符集MySQL 将使用默认配置。默认字符集的优先级顺序如下: - 连接级别(Connection Level) - 数据库级别(Database Level) - 服务器级别(Server Level) 可以通过以下命令查看当前的字符集配置: ```sql SHOW VARIABLES LIKE 'character_set%'; SHOW VARIABLES LIKE 'collation%'; ``` #### 4. 关键字符集变量 MySQL 中有多个与字符集相关的变量,其中最重要的是以下几个: - **character_set_client**:客户端发送的数据使用的字符集。 - **character_set_connection**:连接中用于转换字符集的中间字符集。 - **character_set_results**:查询结果返回给客户端时使用的字符集。 这些变量共同决定了数据在客户端与服务器之间的传输过程中的编码转换[^1]。 #### 5. 设置字符集的方法 可以通过多种方式设置 MySQL字符集: - **全局设置**:修改 MySQL 配置文件(如 `my.cnf` 或 `my.ini`),添加或修改以下内容: ```ini [mysqld] character-set-server=utf8mb4 collation-server=utf8mb4_general_ci ``` - **会话设置**:通过 SQL 命令临时更改会话级别字符集: ```sql SET NAMES utf8mb4; ``` - **C API 设置**:在使用 MySQL C API 时,可以通过 `mysql_options` 函数设置连接字符集,避免显式调用 `SET NAMES`[^4]。 #### 6. 常见问题及解决方案 以下是与 MySQL 字符集相关的常见问题及其解决方法: - **乱码问题**:通常是因为字符集不匹配导致的。确保从客户端到服务器再到存储的所有环节都使用相同的字符集。例如,将所有字符集统一为 `utf8mb4`。 - **插入失败问题**:如果插入的数据包含超出目标字符集范围的字符(如 `latin1` 不支持的字符),会导致插入失败或数据被替换为问号(`?`)。确保目标列的字符集支持所有可能的字符[^5]。 - **排序问题**:不同的排序规则会影响查询结果的排序顺序。选择合适的排序规则以满足业务需求。 #### 7. 示例代码 以下是一个完整的示例,展示如何设置 MySQL字符集验证其效果: ```sql -- 修改数据库字符集 ALTER DATABASE my_database CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci; -- 修改表字符集 ALTER TABLE my_table CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci; -- 查看当前字符集配置 SHOW VARIABLES LIKE 'character_set%'; SHOW VARIABLES LIKE 'collation%'; ``` ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值