canal同步异常:当表结构变化时,同步失败

canal同步异常:当表结构变化时,同步失败

场景

canal 同步Mysql一段时间后突然失败,报如如下错误:

2021-08-06 16:16:51.732 [MultiStageCoprocessor-Parser-Twt_instance-5] WARN c.a.o.canal.parse.inbound.mysql.dbsync.LogEventConvert - table parser error : header {

version: 1

logfileName: "mysql3306-bin.001715"

logfileOffset: 970738018

rowDatas {

beforeColumns {

index: 0

sqlType: 4

updated: false

isNull: false

value: "2443"

}

....

经定位发现,部分表结构发生变化造成的binlog无法解析。

当前集群采用的是默认的tsdb方案,也就是内嵌的H2数据库。

在HA环境下如果发生Server切换/表结构变更,会出现无法正确解析Binlog的问题。

解决方案

采用MySQL作为Canal的tsdb存储

  • 之前的配置
# table meta tsdb info

canal.instance.tsdb.enable = true

canal.instance.tsdb.dir = ${canal.file.data.dir:../conf}/${canal.instance.destination:}

canal.instance.tsdb.url = jdbc:h2:${canal.instance.tsdb.dir}/h2;CACHE_SIZE=1000;MODE=MYSQL;

canal.instance.tsdb.dbUsername = canal

canal.instance.tsdb.dbPassword = canal

  • 解决方案

集群的配置只要把H2改为mysql就可以了,显然要进行元数据管理,
但是我们在之前执行的sql中并不包含相关的建表语句。

到官网去找相关建表语句:

CREATE TABLE IF NOT EXISTS `meta_history` (

`id` bigint(20) unsigned NOT NULL AUTO_INCREMENT COMMENT '主键',

`gmt_create` datetime NOT NULL COMMENT '创建时间',

`gmt_modified` datetime NOT NULL COMMENT '修改时间',

`destination` varchar(128) DEFAULT NULL COMMENT '通道名称',

`binlog_file` varchar(64) DEFAULT NULL COMMENT 'binlog文件名',

`binlog_offest` bigint(20) DEFAULT NULL COMMENT 'binlog偏移量',

`binlog_master_id` varchar(64) DEFAULT NULL COMMENT 'binlog节点id',

`binlog_timestamp` bigint(20) DEFAULT NULL COMMENT 'binlog应用的时间戳',

`use_schema` varchar(1024) DEFAULT NULL COMMENT '执行sql时对应的schema',

`sql_schema` varchar(1024) DEFAULT NULL COMMENT '对应的schema',

`sql_table` varchar(1024) DEFAULT NULL COMMENT '对应的table',

`sql_text` longtext DEFAULT NULL COMMENT '执行的sql',

`sql_type` varchar(256) DEFAULT NULL COMMENT 'sql类型',

`extra` text DEFAULT NULL COMMENT '额外的扩展信息',

PRIMARY KEY (`id`),

UNIQUE KEY binlog_file_offest(`destination`,`binlog_master_id`,`binlog_file`,`binlog_offest`),

KEY `destination` (`destination`),

KEY `destination_timestamp` (`destination`,`binlog_timestamp`),

KEY `gmt_modified` (`gmt_modified`)

) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8 COMMENT='表结构变化明细表';
CREATE TABLE IF NOT EXISTS `meta_snapshot` (

`id` bigint(20) unsigned NOT NULL AUTO_INCREMENT COMMENT '主键',

`gmt_create` datetime NOT NULL COMMENT '创建时间',

`gmt_modified` datetime NOT NULL COMMENT '修改时间',

`destination` varchar(128) DEFAULT NULL COMMENT '通道名称',

`binlog_file` varchar(64) DEFAULT NULL COMMENT 'binlog文件名',

`binlog_offest` bigint(20) DEFAULT NULL COMMENT 'binlog偏移量',

`binlog_master_id` varchar(64) DEFAULT NULL COMMENT 'binlog节点id',

`binlog_timestamp` bigint(20) DEFAULT NULL COMMENT 'binlog应用的时间戳',

`data` longtext DEFAULT NULL COMMENT '表结构数据',

`extra` text DEFAULT NULL COMMENT '额外的扩展信息',

PRIMARY KEY (`id`),

UNIQUE KEY binlog_file_offest(`destination`,`binlog_master_id`,`binlog_file`,`binlog_offest`),

KEY `destination` (`destination`),

KEY `destination_timestamp` (`destination`,`binlog_timestamp`),

KEY `gmt_modified` (`gmt_modified`)

) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8 COMMENT='表结构记录表快照表';

在canal_manager库中执行执行上述两个语句

修改集群配置文件

# table meta tsdb info

canal.instance.tsdb.enable = true

canal.instance.tsdb.url=jdbc:mysql://172.x.x.x:3306/canal_manager

canal.instance.tsdb.dbUsername = canal

canal.instance.tsdb.dbPassword = canal
#canal.instance.tsdb.spring.xml = classpath:spring/tsdb/h2-tsdb.xml

canal.instance.tsdb.spring.xml = classpath:spring/tsdb/mysql-tsdb.xml

保存配置,重启集群

SQL Server 中,`EXISTS` 是一个用于检查是否存在符合特定条件的记录的逻辑运算符。`EXISTS` 返回一个布尔值,即 `TRUE` 或 `FALSE`,表示查询结果集是否包含匹配条件的记录。下面是 `EXISTS` 的详细用法: 1. 基本语法: ```sql SELECT column_name(s) FROM table_name WHERE EXISTS (SELECT column_name FROM table_name WHERE condition); ``` 2. 示例: 假设有两个表,分别为 `customers` 和 `orders`, `customers` 表中包含了所有客户的信息,而 `orders` 表中包含了所有的订单信息。我们需要查询所有已经下过订单的客户的姓名和地址,可以使用以下 SQL 语句: ```sql SELECT customerName, address FROM customers WHERE EXISTS (SELECT * FROM orders WHERE orders.customerID = customers.customerID); ``` 在上面的 SQL 语句中,`EXISTS` 子查询中的条件是查找 `orders` 表中的所有记录,其中 `orders.customerID = customers.customerID` 表示连接两个表的条件,即匹配两个表中的 `customerID` 列。如果 `EXISTS` 子查询返回 `TRUE`,则 `customerName` 和 `address` 列的值会被返回。 3. 注意事项: - `EXISTS` 子查询必须包含一个 `SELECT` 语句,该语句必须返回一个结果集。 - `EXISTS` 子查询中的条件必须使用外部查询中的列或表。 - `EXISTS` 子查询中的 `SELECT` 语句可以是任何有效的 T-SQL 查询语句,包括 `SELECT *`。 - `EXISTS` 子查询中的条件可以包含任何有效的 T-SQL 表达式和运算符。 - `EXISTS` 的性能比使用 `JOIN` 进行连接查询要高,特别是在查询大型数据集时。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值