mysql字符集

http://www.linux-centos.com/2013/08/06/mysql%E5%AD%97%E7%AC%A6%E9%9B%86/#mysql-3


常用字符集比较

字符集是否定长编码方式说明
ASCII单字节7位编码最早的奠基性字符集
ISO-8859-1/latin单字节8位编码西欧字符集经常被用来转码
GB 2312-80双字节编码早期标准,不推荐再使用
GBK双字节编码虽然不是国标,但支持的系统不少
GB 180302字节或4字节编码开始有一些支持,但是数据库支持的还少见
UTF-324字节编码USC-4原始编码,目前较少采用
USC-22字节编码Windows2000内部用USC-2
UTF-162字节或4字节编码JAVA和windows xp/nt内部使用UTF-16
UTF-81~4字节编码互联网和UNIX/LINUX广泛支持的UNICODE字符集;mysql server也使用UTF-8

如何选择合适的字符集

  • 满足应用支持的语言要求,如果应用要处理各种各样的文字,或者将发布到使用不同语言的国家。就应该使用Unicode字符集。对mysql来说,现在就是UTF-8
  • 应用中如果涉及到数据导入,就需要考虑数据库字符集对已有数据的兼容性。假如已有数据是GBK文字,如把需要导入的数据的字符集设置为GB 2313-80,就很可能出现某些文字无法正确导入。
  • 如果数据库只需要支持一般中文,数据量很大,对性能要求较高,那就应该选择双字节定长编码的字符集,比如GBK。因为对于UTF-8而言,GBK比较小,每个汉字只占2个字节,而UTF-8汉字编码需要3个字节,这样可以减少磁盘IO、数据库cache,以及网络传输的时间,从而提高性能。相反,如果应用主要处理英文字符,仅有少量汉字数据,那应该选择UTF-8会更好,因为GBK、USC-2、UTF-16的西文字符编码都是两个字节,会造成不必要的开销

mysql的字符集简介

同一台服务器、同一个数据库甚至同一个表的不同字段都可以指定使用不同的字符集。

mysql的字符集包括字符集(CHARACTER)和校对规则(COLLATION)两个概念。字符集是用来定义MYSQL存储字符串的方式,校对规则是定义了比较字符串的方式。

每个字符集至少对应一个校对规则。可用show collcation命令查看

校对规则命名约定:他们以其相关的字符集名开始,通常包括一个语言名,并且以ci(大小写不敏感),_cs(大小写敏感)或_bin(二元,即比较是基于字符编码的值而与language无关)结束。

mysql字符集的设置

mysql字符集和校对规则支持四个级别的默认设置:服务器级、数据库级、表级和字段级。他们分别在不同的地方设置,作用也不相同。

服务器级字符集和校对规则

如果没有指定服务器字符集,默认会使用latin1作为服务器字符集。上面三种方式只是指定了字符集,没有指定校对规则,所以会使用该字符集的默认校对规则,如果要使用该字符集的非默认校对规则,需要在指定字符集的同时指定校对规则。

数据库字符集和校对规则

需要注意,如果数据库里已经存在数据,因为修改字符集不能将已有的数据按照新的字符集进行存放,所以不能通过直接修改数据库的字符集直接修改数据内容。所以在创建数据库的时候最好明确指定字符集和校对规则,避免收到默认值的影响。

表字符集和校对规则

同样,如果表中已有数据,修改字符集对原有记录并没有影响,不会按照新的字符集进行存放。表的字段仍然使用原来的字符集。所以最好在创建表的时候也指定好字符集和校对规则。

列字符集和校对规则

连接字符集和校对规则

mysql字符集的修改步骤


### MySQL 字符集设置及常见问题 MySQL字符集(Character Set)和排序规则(Collation)是数据库管理中的重要部分,直接影响数据存储、传输以及查询结果的准确性。以下是关于 MySQL 字符集设置及其常见问题的详细说明。 #### 1. 字符集与排序规则的基本概念 字符集定义了数据库如何存储字数据,而排序规则则定义了字数据在比较时的行为方式。例如,在字序 `utf8_general_ci` 下,大小写不敏感,字 "a" 和 "A" 是等价的[^3]。 #### 2. 字符集支持的层次结构 MySQL字符集支持可以细化到四个层次:服务器(server)、数据库(database)、数据表(table)和连接(connection)。每一层都可以独立设置字符集,但若未显式指定,则会继承上一层的默认值[^2]。 #### 3. 默认字符集的来源 如果在创建数据库或数据表时未明确指定字符集MySQL 将使用默认配置。默认字符集的优先级顺序如下: - 连接级别(Connection Level) - 数据库级别(Database Level) - 服务器级别(Server Level) 可以通过以下命令查看当前的字符集配置: ```sql SHOW VARIABLES LIKE 'character_set%'; SHOW VARIABLES LIKE 'collation%'; ``` #### 4. 关键字符集变量 MySQL 中有多个与字符集相关的变量,其中最重要的是以下几个: - **character_set_client**:客户端发送的数据使用的字符集。 - **character_set_connection**:连接中用于转换字符集的中间字符集。 - **character_set_results**:查询结果返回给客户端时使用的字符集。 这些变量共同决定了数据在客户端与服务器之间的传输过程中的编码转换[^1]。 #### 5. 设置字符集的方法 可以通过多种方式设置 MySQL字符集: - **全局设置**:修改 MySQL 配置文件(如 `my.cnf` 或 `my.ini`),添加或修改以下内容: ```ini [mysqld] character-set-server=utf8mb4 collation-server=utf8mb4_general_ci ``` - **会话设置**:通过 SQL 命令临时更改会话级别的字符集: ```sql SET NAMES utf8mb4; ``` - **C API 设置**:在使用 MySQL C API 时,可以通过 `mysql_options` 函数设置连接字符集,避免显式调用 `SET NAMES`[^4]。 #### 6. 常见问题及解决方案 以下是与 MySQL 字符集相关的常见问题及其解决方法: - **乱码问题**:通常是因为字符集不匹配导致的。确保从客户端到服务器再到存储的所有环节都使用相同的字符集。例如,将所有字符集统一为 `utf8mb4`。 - **插入失败问题**:如果插入的数据包含超出目标字符集范围的字(如 `latin1` 不支持的字),会导致插入失败或数据被替换为问号(`?`)。确保目标列的字符集支持所有可能的字[^5]。 - **排序问题**:不同的排序规则会影响查询结果的排序顺序。选择合适的排序规则以满足业务需求。 #### 7. 示例代码 以下是一个完整的示例,展示如何设置 MySQL字符集并验证其效果: ```sql -- 修改数据库字符集 ALTER DATABASE my_database CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci; -- 修改表字符集 ALTER TABLE my_table CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci; -- 查看当前字符集配置 SHOW VARIABLES LIKE 'character_set%'; SHOW VARIABLES LIKE 'collation%'; ``` ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值