MySQL:Slave_SQL_Running_State: System lock

你看到的 Slave_SQL_Running_State: System lock 出现在 SHOW SLAVE STATUS\G 的输出里,通常说明 SQL 线程在等待系统层级的锁。这是 MySQL 复制(传统 binlog replication)中比较常见的状态之一。下面我给你详细解释原因和对应解决思路:


📌 背景知识

在 MySQL 复制中:

  • Slave_IO_Running 负责从主库拉取 binlog 并写到 relay log;
  • Slave_SQL_Running 负责读取 relay log 并执行。
    Slave_SQL_Running_State 是 SQL 线程当前正在做的事情,比如:
  • Reading event from the relay log
  • Waiting for dependent transaction to commit
  • System lock

📌 System lock 的含义

System lock 并不是表级锁或事务锁,而是 MySQL 在 应用 relay log 的 SQL 事件时,需要获取系统层面锁(metadata lock / 文件锁 / binlog dump 锁等),但此时被阻塞了。常见场景:

  1. DDL 与复制冲突

    • 从库正在应用主库的 DDL(比如 ALTER TABLE),需要拿到 metadata lock,但本地有其他会话占用锁(例如正在执行 SELECT … FOR UPDATE)。
  2. 大事务 / 长查询阻塞

    • 主库上执行了大事务,relay log 在应用时,SQL 线程需要锁定表结构,但本地有活跃连接持有 MDL(metadata lock)。
  3. 备份 / 工具冲突

    • 你在从库上跑了 mysqldump --single-transactionpt-online-schema-change 或其他会持有 metadata lock 的工具,SQL 线程就卡住了。

📌 如何确认问题

在从库执行:

SHOW PROCESSLIST\G

看一下 Slave_SQL 线程的状态,以及是否有其他线程正在等待或持有锁。

也可以用:

SHOW ENGINE INNODB STATUS\G

查看是否存在 metadata lock 争用。

MySQL 5.7+ 还可以查:

SELECT * FROM performance_schema.metadata_locks\G

确认是谁占用了 metadata lock。


📌 解决方案

  1. 立即处理阻塞

    • 找到阻塞 Slave_SQL 的会话(一般是 metadata lock),如果允许,可以 KILL <thread_id>
  2. 避免 DDL 与复制冲突

    • 在主库做 DDL 前,评估是否能用 pt-online-schema-change 或 MySQL 8 的 ALGORITHM=INPLACE/INSTANT
    • 从库尽量避免长事务或占用 metadata lock 的会话。
  3. 拆解大事务

    • 如果主库经常有大事务,可以调整业务逻辑,把事务拆小,减少从库复制压力。
  4. 监控与预防

    • 建立对 Slave_SQL_Running_State 的监控,如果长时间停留在 System lock,要告警。
    • 优化备份方式,避免与复制线程抢锁。

✅ 总结:
Slave_SQL_Running_State: System lock 说明 SQL 线程在等待系统级锁,大概率是元数据锁(MDL)阻塞。
排查思路是:先看 SHOW PROCESSLIST / performance_schema.metadata_locks 找阻塞来源 → 结束阻塞会话 → 优化 DDL 和备份流程避免再次发生。

要不要我帮你写一份 快速排查 SQL 线程卡在 System lock 的诊断 SQL 脚本

<think>我们正在排查MySQL主从复制中Slave_IO_Running状态为Connecting的问题。这个状态表示从的I/O线程正在尝试连接主但尚未成功。以下是完整的排查步骤: ### 1. 检查主从基础配置 - **主IP/域名**:确保从配置的主地址正确(`MASTER_HOST`) - **端口**:主防火墙是否开放复制端口(默认3306) - **复制账号**:检查复制账号权限及密码 - **主`server_id`**:必须唯一 **验证命令**: ```sql SHOW SLAVE STATUS\G ``` 关注字段: ``` Master_Host: 192.168.1.100 Master_User: repl_user Master_Port: 3306 Connect_Retry: 60 ``` ### 2. 网络连通性测试 在从执行: ```bash # 测试TCP连接 telnet <主IP> 3306 # 或使用nc nc -zv <主IP> 3306 ``` > 若连接失败,检查: > - 主防火墙:`sudo ufw status`(Ubuntu) > - 云服务器安全组规则 > - 网络路由(尤其跨机房/VPC场景) ### 3. 复制账号权限验证 登录主检查复制账号权限: ```sql SHOW GRANTS FOR 'repl_user'@'从IP'; ``` 必需权限: ```sql GRANT REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO 'repl_user'@'从IP'; ``` ### 4. 主状态检查 登录主查看: ```sql SHOW MASTER STATUS; ``` 确保从连接的`MASTER_LOG_FILE`和`MASTER_LOG_POS`在有效范围内(新搭建复制时需特别注意) ### 5. 错误日志分析 - **从错误日志**: ```bash tail -f /var/log/mysql/error.log ``` 常见错误: ``` [ERROR] Slave I/O: error connecting to master 'repl_user@主IP:3306' - retry-time: 60 retries: 1, Error_code: 2003 ``` ### 6. 主连接限制检查 - 主`max_connections`是否已满 - 主`max_user_connections`是否限制复制账号 ### 7. SSL/TLS配置问题 若主从启用SSL: ```sql SHOW SLAVE STATUS\G ``` 检查: ``` Master_SSL_Allowed: Yes Master_SSL_CA_File: /path/to/ca.pem ``` > 证书路径需在从存在且可读 ### 8. 跳过DNS解析 在从`my.cnf`添加: ```ini [mysqld] skip-name-resolve ``` 重启MySQL服务后重试 ### 9. 临时停止IO线程 若之前有未完成的复制操作: ```sql STOP SLAVE IO_THREAD; -- 引用[1]中提到需先停止IO线程 START SLAVE; ``` ### 故障排查流程图 ```mermaid graph TD A[Slave_IO_Running=Connecting] --> B{网络连通性} B -->|失败| C[检查防火墙/路由] B -->|成功| D{复制账号权限} D -->|不足| E[主授权REPLICATION SLAVE] D -->|正常| F{主SHOW MASTER STATUS} F -->|无输出| G[主未启用二进制日志] F -->|正常| H{错误日志分析} H -->|SSL错误| I[检查证书路径] H -->|连接数超限| J[调整max_connections] H -->|其他错误| K[根据错误码处理] ``` ### 关键命令汇总 | 步骤 | 命令 | |------|------| | 检查复制状态 | `SHOW SLAVE STATUS\G` | | 测试主端口 | `nc -zv 主IP 3306` | | 主授权复制账号 | `GRANT REPLICATION SLAVE ON *.* TO 'repl_user'@'从IP' IDENTIFIED BY '密码'` | | 重置复制线程 | `STOP SLAVE; START SLAVE;` | > **注意**:修改配置后需重启MySQL服务:`sudo systemctl restart mysql` §§相关问题§§ 1. 如何修复MySQL主从复制错误1236? 2. 主从复制延迟持续增长该如何处理? 3. MySQL多源复制如何配置? 4. 如何监控MySQL复制状态? 5. 如何配置安全的复制账号?</think>### MySQL Slave_IO_Running 状态为 "Connecting" 的排查指南 当 MySQL 主从复制中 Slave_IO_Running 状态显示为 "Connecting" 时,表示从的 I/O 线程正在尝试连接主但尚未成功。以下是系统化的排查步骤: --- #### 1. **检查基础配置** ```sql SHOW SLAVE STATUS\G ``` 关注以下字段: - `Master_Host`:主 IP 是否正确 - `Master_User`:复制账号是否存在 - `Master_Port`:端口是否匹配主 - `Master_SSL_Allowed`:SSL 配置是否一致 > **关键点**:确保从配置的 IP、端口、账号与主一致[^2]。 --- #### 2. **网络连通性测试** 在从执行: ```bash # 测试主端口连通性 telnet <Master_IP> 3306 # 或使用网络工具 nc -zv <Master_IP> 3306 ``` - 若连接失败,检查: - 防火墙规则(主/从双方) - 云服务器安全组 - 路由表/NAT 配置 --- #### 3. **验证复制账号权限** 登录主检查账号权限: ```sql SHOW GRANTS FOR 'repl_user'@'从IP'; ``` 必需权限: ```sql GRANT REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO 'repl_user'@'从IP'; ``` --- #### 4. **检查主状态** 在主执行: ```sql SHOW MASTER STATUS; ``` 确保从连接的 `MASTER_LOG_FILE` 和 `MASTER_LOG_POS` 在有效范围内。 --- #### 5. **分析错误日志** 查看从错误日志: ```bash tail -f /var/log/mysql/error.log ``` 常见错误示例: ``` [ERROR] Slave I/O: error connecting to master 'repl_user@主IP:3306' - retry-time: 60 retries: 1, Error_code: 2003 ``` - **Error_code 2003**:网络连接问题 - **Error_code 1045**:账号认证失败 - **Error_code 2061**:SSL 配置错误 --- #### 6. **特殊场景处理** - **SSL 连接问题**: 若主启用 SSL,需确保从有正确的证书: ```sql CHANGE MASTER TO MASTER_SSL=1, MASTER_SSL_CA='/path/to/ca.pem', MASTER_SSL_CERT='/path/to/client-cert.pem', MASTER_SSL_KEY='/path/to/client-key.pem'; ``` - **多源复制冲突**: 检查 `REQUIRE_TABLE_PRIMARY_KEY_CHECK` 设置是否一致[^2] - **IO 线程阻塞**: 按引用[1]建议停止 IO 线程: ```sql STOP SLAVE IO_THREAD; -- 先停止线程 START SLAVE; -- 重新启动 ``` --- #### 7. **防火墙与 SELinux** ```bash # 检查防火墙 sudo ufw status # 临时开放端口 sudo ufw allow 3306 # 检查 SELinux sudo sestatus sudo setsebool -P mysqld_connect_any 1 ``` --- ### 故障排查流程图 ```mermaid graph TD A[Slave_IO_Running=Connecting] --> B{网络连通性} B -->|失败| C[检查防火墙/路由] B -->|成功| D{复制账号权限} D -->|不足| E[主授权REPLICATION SLAVE] D -->|正常| F{主SHOW MASTER STATUS} F -->|无输出| G[主未启用二进制日志] F -->|正常| H{错误日志分析} H -->|SSL错误| I[配置证书] H -->|认证失败| J[重置复制密码] H -->|其他错误| K[根据错误码处理] ``` --- ### 修复后验证 ```sql STOP SLAVE; START SLAVE; SHOW SLAVE STATUS\G ``` 期望输出: ``` Slave_IO_Running: Yes Slave_SQL_Running: Yes Last_IO_Error: ``` > **注意**:修改配置后需重启 MySQL 服务:`sudo systemctl restart mysql`
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值