修改MySQL字符编码

修改编码其实是为了支持中文~

1. 编译级别。由于缺乏大量自己去编译MySQL的经验,所以对具体的编译优化不太熟悉,可参考简朝阳的《MySQL性能调优与架构设计》。以下内容来自《MySQL 5.1参考手册》2.8.2. 典型配置选项:

  • 默认地,MySQL使用latin1(cp1252)字符集。为了改变 默认设置,使用--with-charset选项:
  • shell> ./configure -- with-charset=CHARSET

警告: 如果你在创建了任何数据库表之后改变字符集,你将必须对每个表运行myisamchk -r -q --set-character-set= charset ,否则索引可能不正确地排序。

2. 启动参数。启动参数可以直接加在启动服务的命令后面,也可以加在配置文件中。如:

(1)mysqld --defaults-file="my-small.ini" --console --character-set-server=utf8 --basedir="C:\mysql-5.5.21-win32" --datadir="C:\mysql-5.5.21-win32\data"

(2)在配置文件的[mysqld]节点中添加:character-set-server = "utf8"

  • --character-set-server=charset

该启动参数在MySQL的各版本中可能有差异,具体参见文档。

注意: default-character-set这个参数已经在新版的MySQL中取消使用,在部分旧版中也已经deprecated而不起作用。 使用配置变量“character_set”(低于4.1.0的服务器版本)和“character_set_server”(4.1.0和更高的服务器版本)指定。

我测试的版本是5.5.21,查看版本号的方式,以下内容来自:查看mysql版本的四种方法

1 select version();
2 status;

3. 查看编码。

1 show variables like '%char%' ;

 

| character_set_client        | gbk
| character_set_connection | gbk
| character_set_database   | utf8
| character_set_filesystem  | binary
| character_set_results       | gbk
| character_set_server       | utf8
| character_set_system      | utf8

得到类似这样的结果,可以使用下面的方法修改编码(该方法仅对当前连接生效,并且不会改变已存储的数据的编码):

1 SET character_set_client = utf8;
2 SET character_set_results = utf8;
3 SET character_set_connection = utf8;

4. 内部编码。指数据库、表、字段的编码。以下内容来自:mysql修改表、字段、库的字符集

修改数据库字符集:

ALTER
 DATABASE
 db_name DEFAULT
 CHARACTER
 SET
 character_name [
COLLATE
 ...
]
;

把表默认的字符集和所有字符列(CHAR,VARCHAR,TEXT)改为新的字符集:

ALTER
 TABLE
 tbl_name CONVERT
 TO
 CHARACTER
 SET
 character_name [
COLLATE
 ...
]
 如:ALTER
 TABLE
 logtest CONVERT
 TO
 CHARACTER
 SET
 utf8 COLLATE
 utf8_general_ci;

只是修改表的默认字符集:

ALTER
 TABLE
 tbl_name DEFAULT
 CHARACTER
 SET
 character_name [
COLLATE
...
]
;
如:ALTER
 TABLE
 logtest DEFAULT
 CHARACTER
 SET
 utf8 COLLATE
 utf8_general_ci;

修改字段的字符集:

ALTER
 TABLE
 tbl_name CHANGE
 c_name c_name CHARACTER
 SET
 character_name [
COLLATE
 ...
]
;
如:ALTER
 TABLE
 logtest CHANGE
 title title VARCHAR
(
100
)
 CHARACTER
 SET
 utf8 COLLATE
 utf8_general_ci;

查看数据库编码:

SHOW
 CREATE
 DATABASE
 db_name;

查看表编码:

SHOW
 CREATE
 TABLE
 tbl_name;

查看字段编码:

SHOW
 FULL
 COLUMNS
 FROM
 tbl_name;

5. 连接方式。对于MySQL Connector/J方式,可以使用如下设置,来自“26.3.3.4. 使用字符集和Unicode”:

在MySQL服务器4.1之前,Connector/J支持每连接单一字符编码,能够从服务器配置自动检测到它,也能由用户通过使用useUnicode characterEncoding 属性配置它。

从MySQL服务器4.1版起,Connector/J支持客户端和服务器之间的单一字符编码,以及针对结果集中从服务器返回至客户端的数据的任意数目字符编码。

具体的连接示例:jdbc:mysql://127.0.0.1:3306/test?useUnicode=true&characterEncoding=utf8&autoReconnect=true

 

END. 以下内容来自:MYSQL 字符集问题

 MySQL对于字符集的指定可以细化到一个数据库,一张表,一列,应该用什么字符集。

但是,传统的 程序在创建数据库和数据表时并没有使用那么复杂的配置,它们用的是默认的配置,那么,默认的配置从何而来呢?

    (1)编译MySQL 时,指定了一个默认的字符集,这个字符集是 latin1;
    (2)安装MySQL 时,可以在配置文件 (my.ini) 中指定一个默认的的字符集,如果没指定,这个值继承自编译时指定的;
    (3)启动mysqld 时,可以在命令行参数中指定一个默认的的字符集,如果没指定,这个值继承自配置文件中的配置,此时  character_set_server  被设定为这个默认的字符集;
    (4)当创建一个新的数据库时,除非明确指定,这个数据库的字符集被缺省设定为 character_set_server ;
    (5)当选定了一个数据库时, character_set_database  被设定为这个数据库默认的字符集;
    (6)在这个数据库里创建一张表时,表默认的字符集被设定为 character_set_database ,也就是这个数据库默认的字符集;
    (7)当在表内设置一栏时,除非明确指定,否则此栏缺省的字符集就是表默认的字符集;

简单的总结一下,如果什么地方都不修改,那么所有的数据库的所有表的所有栏位的都用 latin1 存储,不过我们如果安装 MySQL,一般都会选择多语言支持,也就是说,安装程序会自动在配置文件中把 default_character_set 设置为 UTF-8,这保证了缺省情况下,所有的数据库的所有表的所有栏位的都用 UTF-8 存储。

<think>嗯,我现在需要了解如何在MySQL修改字符编码。我之前对数据库的字符编码了解不多,但知道如果设置不正确,可能会出现乱码或者存储问题。首先,我应该理解MySQL中的字符编码涉及哪些部分。听说有服务器级别、数据库级别、表级别和列级别的设置,可能都需要调整。 首先,用户提到要修改字符编码,可能需要检查当前的字符集设置。我记得有命令可以查看这些信息,比如SHOW VARIABLES LIKE 'char%'; 和 SHOW VARIABLES LIKE 'collation%';,这些应该显示当前的各种字符集和校对规则。不过具体变量名可能记不太准,比如character_set_server、character_set_database这些变量是否正确? 然后,修改字符编码的方法可能有多种。一种是直接在MySQL配置文件中修改,比如my.cnf或my.ini文件,这属于系统级的设置,重启后生效。另一种是运行时通过SQL语句动态修改,但可能只是临时的,重启后会失效。此外,还有在创建或修改数据库、表的时候指定字符集。 接下来,配置文件的具体修改部分可能需要添加或调整[mysqld]下的参数,比如character-set-server和collation-server。例如: [mysqld] character-set-server=utf8mb4 collation-server=utf8mb4_unicode_ci 但是不确定是否还需要设置其他部分,比如客户端和连接的字符集,比如在[client]和[mysql]部分添加default-character-set=utf8mb4,确保客户端连接时的编码正确。 然后是修改现有数据库、表或列的字符集。可能需要使用ALTER DATABASE或ALTER TABLE语句。例如: ALTER DATABASE mydb CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci; ALTER TABLE mytable CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci; 但要注意,转换现有数据可能需要时间,特别是数据量大的时候,而且如果原来的数据存储的编码和新的不兼容,可能会出问题。比如,如果原本是latin1存储的,直接转换可能会出错,可能需要先导出再导入,或者使用mysqldump来处理。 另外,关于字符集的选择,用户可能需要注意utf8和utf8mb4的区别。MySQL的utf8最多支持3字节,而utf8mb4支持4字节,可以存储emoji等字符,所以现在一般推荐使用utf8mb4。 还有,连接时的字符集设置也很重要。即使服务器和数据库的编码正确,如果连接时使用的编码不一致,也会导致乱码。所以可能需要执行SET NAMES 'utf8mb4';或者在连接字符串中指定,比如JDBC的URL中添加useUnicode=true&characterEncoding=UTF-8,不过具体参数可能因驱动而异。 另外,在修改配置后,可能需要重启MySQL服务才能生效,比如在Linux下使用systemctl restart mysql,或者在Windows下通过服务管理器重启。 最后,用户可能需要验证修改后的字符集是否生效,重新运行SHOW VARIABLES查看各个字符集变量是否正确,以及插入测试数据检查是否有乱码。 需要注意的是,修改字符集可能会影响现有数据,所以在操作前最好备份数据库,以防万一。同时,不同的MySQL版本可能有不同的默认字符集,比如MySQL 8.0默认使用utf8mb4,而旧版本可能不是,这也需要考虑。 总结步骤可能包括: 1. 备份数据库。 2. 修改配置文件,设置字符集和校对规则。 3. 重启MySQL服务。 4. 修改现有数据库、表的字符集。 5. 检查连接设置,确保应用程序使用正确的编码连接。 6. 验证和测试。 但具体操作时需要根据实际情况调整,比如是否需要转换现有数据,或者是否有应用程序的代码需要调整连接参数。</think>MySQL修改字符编码需综合考虑服务器、数据库、表和连接等层级的设置。以下是分步说明: --- ### **一、查看当前字符编码** ```sql -- 查看全局字符集变量 SHOW VARIABLES LIKE 'character_set%'; SHOW VARIABLES LIKE 'collation%'; ``` - 关键变量: - `character_set_server`:服务器默认字符集 - `character_set_database`:数据库默认字符集 - `character_set_client`:客户端使用的字符集 - `collation_server`:服务器默认校对规则 --- ### **二、修改配置文件(永久生效)** 1. **找到配置文件**: - Linux:`/etc/mysql/my.cnf` 或 `/etc/mysql/mysql.conf.d/mysqld.cnf` - Windows:`my.ini`(通常在MySQL安装目录) 2. **添加或修改以下配置**: ```ini [mysqld] character-set-server = utf8mb4 collation-server = utf8mb4_unicode_ci [client] default-character-set = utf8mb4 [mysql] default-character-set = utf8mb4 ``` 3. **重启MySQL服务**: ```bash # Linux systemctl restart mysql # Windows(通过服务管理器重启) ``` --- ### **三、动态修改(临时生效)** 通过SQL语句临时调整(重启后失效): ```sql -- 修改全局字符集(需管理员权限) SET GLOBAL character_set_server = 'utf8mb4'; SET GLOBAL collation_server = 'utf8mb4_unicode_ci'; -- 修改当前会话字符集 SET NAMES 'utf8mb4'; ``` --- ### **四、修改现有数据库和表** 1. **修改数据库字符集**: ```sql ALTER DATABASE 数据库名 CHARACTER SET = utf8mb4 COLLATE = utf8mb4_unicode_ci; ``` 2. **修改表字符集**: ```sql ALTER TABLE 表名 CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci; ``` - 注意:此操作会重新编码现有数据,大表可能耗时较长。 --- ### **五、验证修改结果** 1. 重新检查字符集变量: ```sql SHOW VARIABLES LIKE 'character_set%'; ``` 2. 插入测试数据: ```sql INSERT INTO 表名 (字段) VALUES ('测试𝄞'); -- 包含中文和特殊符号 SELECT * FROM 表名; -- 查看是否乱码 ``` --- ### **六、注意事项** 1. **编码选择建议**: - 推荐使用`utf8mb4`(支持Emoji和四字节字符),而非旧版`utf8`(仅三字节)。 - 校对规则根据需求选择,如`utf8mb4_unicode_ci`(通用)或`utf8mb4_general_ci`(简单比较)。 2. **数据兼容性**: - 若原数据为`latin1`等编码,需先导出数据,再以正确编码重新导入。 3. **连接层设置**: - 应用程序连接时需指定字符集(如JDBC URL添加`useUnicode=true&characterEncoding=UTF-8`)。 4. **备份数据**: - 修改字符集前务必备份数据库,避免数据损坏。 --- 通过以上步骤,可系统化调整MySQL字符编码,确保数据存储和传输的一致性。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值