MySQL5.7 快速批量处理 slave从库 Last_Errno: 1062问题

本文介绍了解决MySQL因权限问题导致的数据写入失败及主从同步中出现的重复键错误。通过调整目录权限、使用Shell脚本批量处理1062错误,并最终检查主从数据一致性。

 

运营同事说生成环境的Mysql连接报错处理:Can’t read dir of ’./business_db/’ (errno:13 – Permission denied)

 

 

 

 

上去服务器,查看到原因是,mysql运行过程中,mysql数据存放目录的权限被修改成了其它帐号mongo,所以通过远程查询报错,解决办法是重新赋予mysql帐号权限,chown  -R mysql:mysql/data/mysql,然后再重启mysql(重启过程中,如果正常restart无效,则需要kill 进程号的方式去stop 然后再start)。

 

重启mysql过后的slave报错问题,如下所示:

[root@azure_dbm1_s1 ~]# mysql -e "show slave status\G"

*************************** 1. row ***************************

               Slave_IO_State: Queueing master event to the relay log

                  Master_Host: 101.24.3.61

                  Master_User: repl

                  Master_Port: 3306

                Connect_Retry: 60

              Master_Log_File: mysql-bin.001603

          Read_Master_Log_Pos: 72081748

               Relay_Log_File: mysql-relay-bin.003111

                Relay_Log_Pos: 221898

        Relay_Master_Log_File: mysql-bin.001582

             Slave_IO_Running: Yes

            Slave_SQL_Running: No

              Replicate_Do_DB:

          Replicate_Ignore_DB:

           Replicate_Do_Table:

       Replicate_Ignore_Table:

      Replicate_Wild_Do_Table:

  Replicate_Wild_Ignore_Table:

                   Last_Errno: 1062

                   Last_Error: Could not execute Write_rows event on table business_db.MOVIE_INTERFACE_LOG; Duplicate entry '791212' for key 'PRIMARY', Error_code: 1062; handler error HA_ERR_FOUND_DUPP_KEY; the event's master log mysql-bin.001582, end_log_pos 176650062

                 Skip_Counter: 0

          Exec_Master_Log_Pos: 176641719

              Relay_Log_Space: 13274783505

              Until_Condition: None

………………

 

 

判断是因为,mysql的数据库目录/data/mysql已经被赋予了mongo用户权限,mysql无法写入,所以在slave里面没有记录。但是mysql启动是在root登录通过 service mysql start启动起来的,所以实际上数据已经通过root启动的mysql服务写进数据库了,所以在恢复slave的时候,slave的sql线程依然去执行relay日志,产生了Duplicateentry的问题了。

 

不知道这个判断是否属实?

 

 

批量处理Last_SQL_Errno :1062错误

那么接下来就需要通过

stop slave; setglobal sql_slave_skip_counter=1; start slave;来跳过,但是Duplicate entry的数据太多了,手工执行不过来,需要写一个shell脚本while循环来自动跳过,脚本如下:

 

empty[root@azure_dbm1_s1 scripts]# more slave_1062_stop.sh 
#/bin/bash
slave_num=`mysql -e "show slave status\G" |grep Last_SQL_Errno |awk {'print $2}'`
echo $slave_num
while [[ $slave_num = "1062" ]];
do
	mysql -e "stop slave; set global sql_slave_skip_counter=1; start slave;"
	slave_num=`mysql -e "show slave status\G" |grep Last_SQL_Errno |awk {'print $2}'`
done
[root@azure_dbm1_s1 scripts]#

 

 

 

[root@azure_dbm1_s1 scripts]# more slave_1062_stop.sh

#/bin/bash

slave_num=`mysql -e "show slave status\G" |grep Last_SQL_Errno |awk {'print $2}'`

echo $slave_num

while [[ $slave_num = "1062" ]];

do

         mysql -e "stop slave; set global sql_slave_skip_counter=1; start slave;"

         slave_num=`mysql -e "show slave status\G" |grep Last_SQL_Errno |awk {'print $2}'`

done

[root@azure_dbm1_s1 scripts]#

 

然后执行脚本,如下:

# 开始执行脚本,等待

[root@azure_dbm1_s1 scripts]# sh slave_1062_stop.sh

1062

[root@azure_dbm1_s1 scripts]#

[root@azure_dbm1_s1 scripts]#

 

# 执行结束后,再执行下,确认Last_SQL_Errno是否正常值0

[root@azure_dbm1_s1 scripts]# sh slave_1062_stop.sh

0

[root@azure_dbm1_s1 scripts]#

 

用脚本自动化运行,比手动在命令行执行stop slave; set globalsql_slave_skip_counter=1; start slave;要方便很多。

 

 

最后用checksum检查主从数据一致性:

 

# 下载安装percona-toolkit

wget https://www.percona.com/downloads/percona-toolkit/2.2.17/deb/percona-toolkit_2.2.17-1.tar.gz

tar -xvf percona-toolkit_2.2.17-1.tar.gz

cd percona-toolkit-2.2.17/

yum install perl-DBD-MySQL -y

perl Makefile.PL

make

make test

make install

cp /usr/local/bin/pt* /bin/

 

# 开始check主从数据一致性

pt-table-checksum --nocheck-replication-filters --replicate=test.dsns --host=101.24.3.61 --port 3306 --databases=business_db -urepl -pPlcc0805@replication   --no-check-binlog-format  --no-replicate-check

<think>我们正在排查MySQL主从复制中Slave_IO_Running状态为Connecting的问题。这个状态表示从的I/O线程正在尝试连接主但尚未成功。以下是完整的排查步骤: ### 1. 检查主从基础配置 - **主IP/域名**:确保从配置的主地址正确(`MASTER_HOST`) - **端口**:主防火墙是否开放复制端口(默认3306) - **复制账号**:检查复制账号权限及密码 - **主`server_id`**:必须唯一 **验证命令**: ```sql SHOW SLAVE STATUS\G ``` 关注字段: ``` Master_Host: 192.168.1.100 Master_User: repl_user Master_Port: 3306 Connect_Retry: 60 ``` ### 2. 网络连通性测试 在从执行: ```bash # 测试TCP连接 telnet <主IP> 3306 # 或使用nc nc -zv <主IP> 3306 ``` > 若连接失败,检查: > - 主防火墙:`sudo ufw status`(Ubuntu) > - 云服务器安全组规则 > - 网络路由(尤其跨机房/VPC场景) ### 3. 复制账号权限验证 登录主检查复制账号权限: ```sql SHOW GRANTS FOR 'repl_user'@'从IP'; ``` 必需权限: ```sql GRANT REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO 'repl_user'@'从IP'; ``` ### 4.状态检查 登录主查看: ```sql SHOW MASTER STATUS; ``` 确保从连接的`MASTER_LOG_FILE`和`MASTER_LOG_POS`在有效范围内(新搭建复制时需特别注意) ### 5. 错误日志分析 - **从错误日志**: ```bash tail -f /var/log/mysql/error.log ``` 常见错误: ``` [ERROR] Slave I/O: error connecting to master 'repl_user@主IP:3306' - retry-time: 60 retries: 1, Error_code: 2003 ``` ### 6.连接限制检查 - 主`max_connections`是否已满 - 主`max_user_connections`是否限制复制账号 ### 7. SSL/TLS配置问题 若主从启用SSL: ```sql SHOW SLAVE STATUS\G ``` 检查: ``` Master_SSL_Allowed: Yes Master_SSL_CA_File: /path/to/ca.pem ``` > 证书路径需在从存在且可读 ### 8. 跳过DNS解析 在从`my.cnf`添加: ```ini [mysqld] skip-name-resolve ``` 重启MySQL服务后重试 ### 9. 临时停止IO线程 若之前有未完成的复制操作: ```sql STOP SLAVE IO_THREAD; -- 引用[1]中提到需先停止IO线程 START SLAVE; ``` ### 故障排查流程图 ```mermaid graph TD A[Slave_IO_Running=Connecting] --> B{网络连通性} B -->|失败| C[检查防火墙/路由] B -->|成功| D{复制账号权限} D -->|不足| E[主授权REPLICATION SLAVE] D -->|正常| F{主SHOW MASTER STATUS} F -->|无输出| G[主未启用二进制日志] F -->|正常| H{错误日志分析} H -->|SSL错误| I[检查证书路径] H -->|连接数超限| J[调整max_connections] H -->|其他错误| K[根据错误码处理] ``` ### 关键命令汇总 | 步骤 | 命令 | |------|------| | 检查复制状态 | `SHOW SLAVE STATUS\G` | | 测试主端口 | `nc -zv 主IP 3306` | | 主授权复制账号 | `GRANT REPLICATION SLAVE ON *.* TO 'repl_user'@'从IP' IDENTIFIED BY '密码'` | | 重置复制线程 | `STOP SLAVE; START SLAVE;` | > **注意**:修改配置后需重启MySQL服务:`sudo systemctl restart mysql` §§相关问题§§ 1. 如何修复MySQL主从复制错误1236? 2. 主从复制延迟持续增长该如何处理? 3. MySQL多源复制如何配置? 4. 如何监控MySQL复制状态? 5. 如何配置安全的复制账号?</think>### MySQL Slave_IO_Running 状态为 "Connecting" 的排查指南 当 MySQL 主从复制中 Slave_IO_Running 状态显示为 "Connecting" 时,表示从的 I/O 线程正在尝试连接主但尚未成功。以下是系统化的排查步骤: --- #### 1. **检查基础配置** ```sql SHOW SLAVE STATUS\G ``` 关注以下字段: - `Master_Host`:主 IP 是否正确 - `Master_User`:复制账号是否存在 - `Master_Port`:端口是否匹配主 - `Master_SSL_Allowed`:SSL 配置是否一致 > **关键点**:确保从配置的 IP、端口、账号与主一致[^2]。 --- #### 2. **网络连通性测试** 在从执行: ```bash # 测试主端口连通性 telnet <Master_IP> 3306 # 或使用网络工具 nc -zv <Master_IP> 3306 ``` - 若连接失败,检查: - 防火墙规则(主/从双方) - 云服务器安全组 - 路由表/NAT 配置 --- #### 3. **验证复制账号权限** 登录主检查账号权限: ```sql SHOW GRANTS FOR 'repl_user'@'从IP'; ``` 必需权限: ```sql GRANT REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO 'repl_user'@'从IP'; ``` --- #### 4. **检查主状态** 在主执行: ```sql SHOW MASTER STATUS; ``` 确保从连接的 `MASTER_LOG_FILE` 和 `MASTER_LOG_POS` 在有效范围内。 --- #### 5. **分析错误日志** 查看从错误日志: ```bash tail -f /var/log/mysql/error.log ``` 常见错误示例: ``` [ERROR] Slave I/O: error connecting to master 'repl_user@主IP:3306' - retry-time: 60 retries: 1, Error_code: 2003 ``` - **Error_code 2003**:网络连接问题 - **Error_code 1045**:账号认证失败 - **Error_code 2061**:SSL 配置错误 --- #### 6. **特殊场景处理** - **SSL 连接问题**: 若主启用 SSL,需确保从有正确的证书: ```sql CHANGE MASTER TO MASTER_SSL=1, MASTER_SSL_CA='/path/to/ca.pem', MASTER_SSL_CERT='/path/to/client-cert.pem', MASTER_SSL_KEY='/path/to/client-key.pem'; ``` - **多源复制冲突**: 检查 `REQUIRE_TABLE_PRIMARY_KEY_CHECK` 设置是否一致[^2] - **IO 线程阻塞**: 按引用[1]建议停止 IO 线程: ```sql STOP SLAVE IO_THREAD; -- 先停止线程 START SLAVE; -- 重新启动 ``` --- #### 7. **防火墙与 SELinux** ```bash # 检查防火墙 sudo ufw status # 临时开放端口 sudo ufw allow 3306 # 检查 SELinux sudo sestatus sudo setsebool -P mysqld_connect_any 1 ``` --- ### 故障排查流程图 ```mermaid graph TD A[Slave_IO_Running=Connecting] --> B{网络连通性} B -->|失败| C[检查防火墙/路由] B -->|成功| D{复制账号权限} D -->|不足| E[主授权REPLICATION SLAVE] D -->|正常| F{主SHOW MASTER STATUS} F -->|无输出| G[主未启用二进制日志] F -->|正常| H{错误日志分析} H -->|SSL错误| I[配置证书] H -->|认证失败| J[重置复制密码] H -->|其他错误| K[根据错误码处理] ``` --- ### 修复后验证 ```sql STOP SLAVE; START SLAVE; SHOW SLAVE STATUS\G ``` 期望输出: ``` Slave_IO_Running: Yes Slave_SQL_Running: Yes Last_IO_Error: ``` > **注意**:修改配置后需重启 MySQL 服务:`sudo systemctl restart mysql`
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值