Illegal mix of collations

本文探讨了在MySQL中遇到的关联查询时出现的字符集不匹配错误,即`utf8mb4_unicode_ci`和`utf8mb4_general_ci`的混合使用问题。错误表明不同排序规则导致无法进行等值比较。排序规则(collations)用于规定字符比较的规则,解决多语言环境下数据的排序和比较。当不同表或字段的排序规则不一致时,会导致查询失败。解决方法是统一数据库、表或字段的排序规则,通过查询和修改数据库或表的默认排序规则来达到一致。此外,还提供了查询和修改排序规则的SQL语句,以及查看数据库表死锁记录的方法。

1、背景

  • 在做关联查询时候出现问题

  • select * from A where ref_b_id = (select id from b where user_id='11');
    
  • 将会提示你如下错误

  • Illegal mix of collations (utf8mb4_unicode_ci,IMPLICIT) and (utf8mb4_general_ci,IMPLICIT) for operation '='.md
    

2、分析

  1. 由上面字面意思就是 utf8mb4_unicode_ci 和 utf8mb4_general_ci 混合使用,同时也说明不能混合使用

  2. collations关键字是排序规则,a和A同时存在,顺序应该是aA还是Aa, 或者说a==A? 不区分大小吗?

    • 1、为啥需要存在collations? 它解决什么问题?
      
      		第一点世界上有很多种语言,语言差异很大,比如中文和日元有相似地方,但是不一样,
      		所有不同字符集去编码对应语言,比如现在已经编码好保存到数据库了,我们现在需要查询,
      		数据库怎么知道那条数据算第一条数据,数据库肯定是对所有数据进行比较,
      		最常见就是ASCII的字符代表数字大小,还有一些情况我们就是认为区分大小(默认是不区分)a A是不一样,
      		这些字符的比较工作需要有评判规则,而这些规则就是collations所做的事情。
      
      
  3. 不同字符比较规则,自然就不能关联比较了,也就不能用等号,日语的某些汉字和中文汉字虽然展示是一样但是实际编码规则是不一样

3、解决方法

  • 解决方式:让两个表统一一下collations

3.1、怎么统一collations

  1. 如何查询表使用哪个collations

    SHOW FULL COLUMNS FROM 数据库名.表名
    
    • image-20210527150548543
    • 可以看出目前是collation的是utf8mb4_general_ci
  2. 如何查看当前数据库schema的collation?

    • SHOW VARIABLES LIKE 'collation_database';
      
  3. 如何修改当前数据库默认collation?例如修改为 utf8mb4_unicode_ci

    • ALTER DATABASE COLLATE utf8mb4_unicode_ci;
      
  4. 如何修改当前表默认collation? 例如修改为 utf8mb4_unicode_ci

    • ALTER TABLE t_application_ocr_result  COLLATE utf8mb4_unicode_ci;
      
  5. 如何修改某个表的字段默认collation 例如修改user_id为 utf8mb4_unicode_ci

    • ALTER TABLE t_application_ocr_result  MODIFY  user_id varchar(28) COLLATE utf8mb4_unicode_ci;
      
      
  6. 查看数据库表死锁记录

    • SHOW ENGINE INNODB STATUS; 
      SELECT * FROM INFORMATION_SCHEMA.INNODB_LOCKS;
      

3、参考

  1. 如何使得mysql不区分大小写?:How can I make SQL case sensitive string comparison on MySQL?
  2. Mysql的collation是什么?https://www.quora.com/What-is-collation-in-MySQL
  3. MySQL查看、修改字符集及Collation
`illegal mix of collations` 是 MySQL 数据库中常见的错误提示之一。这个错误通常发生在数据库对字符串数据进行比较、排序或连接操作时,涉及到字符集(Character Set)和校验规则(Collation)不一致的情况。 ### 具体原因分析 MySQL 中的字符集决定了如何存储字符,而校验规则则规定了字符之间的比较方式。如果查询涉及来自不同表、列甚至表达式的数据,并且它们使用的校验规则互不兼容,则会引发此错误。 例如: - 表 A 的某一列为 `utf8_general_ci` - 表 B 的另一列为 `utf8_bin` 当试图将这两者进行比较或联合操作时,就会因为无法自动转换而导致报错。 ### 解决方案 1. **统一字段的 Collation** 修改所有相关字段到相同的校验规则是最直接的办法。可以使用下面命令更改特定列的 collation 属性: ```sql ALTER TABLE your_table_name MODIFY column_name VARCHAR(255) CHARACTER SET utf8 COLLATE utf8_general_ci; ``` 2. **强制指定临时校验规则** 如果不想修改原有结构,在 SQL 查询语句里通过 CAST 或 CONVERT 函数明确地把某个值转化成目标格式也可以避免冲突。比如: ```sql SELECT * FROM table_a a JOIN table_b b ON a.col = CONVERT(b.col USING utf8); ``` 3. **检查并调整全局设置** 查看当前服务器默认字符集配置是否合理,必要时候更新 my.cnf 文件里的选项如 [character-set-server](https://dev.mysql.com/doc/refman/8.0/en/server-system-variables.html#sysvar_character_set_server),保证新建内容不会再次出现类似问题。 ### 小结 总之,“Illegal Mix Of Collations”提醒开发者注意保持系统内一致性的问题。尽量从设计阶段就确立好标准能减少后期维护成本。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值