pt-online-schema-change [OPTIONS] DSN
OPTIONS的格式是--option value,前缀是两道杠,option和value用空格分隔,value的格式需要看文档,各个选项下都有value类型的说明(string, DSN等)
DSN(Data Source Name)的格式是option=value,等号两边不允许有空格,如果value有空格,那么value必须用引号括起来,多个DSN选项用逗号分隔
以下是常用选项
--help
帮助,会显示所有可用选项以及默认值,个人认为是个体验非常好的help
输出执行过程中的语句
,建议打开
--progress
type: array; default: time,30
输出复制行的进度到STDERR(不是很明白为什么不输出到STDOUT),逗号分割的列表,每个item分两部分,第一部分是进度item,后部分是输出频率,比如time,30,表示每30秒输出一次,再比如time,30,percentage,1,表示每30秒或者每1百分点输出一次
--[no]version-check
default: yes
这是个工具自动检查更新的功能,默认是打开的,如果有报错建议关闭(我的阿里云RDS用这个选项就不行),该选项会检查工具本身的版本,还有操作系统、Percona监控管理,MySQL,Perl等等的版本。除此之外,还会提示用户已知的bug或特殊情况。
--recursion-method
type: array; default: processlist,hosts
默认情况下,工具会监控从库的延迟,那么它怎么发现从库呢?就是由这个选项控制的
METHOD USES =========== ================== processlist SHOW PROCESSLIST hosts SHOW SLAVE HOSTS dsn=DSN DSNs from a table none Do not find slaves
默认情况下,工具会在主库执行SHOW PROCESSLIST,然后会出来一堆连接到主库的客户端,对这些客户端一个个试它们的3306端口,就知道哪些是从库了,不过如果从库端口不是3306就不好使了。用SHOW SLAVE HOSTS可以避免这个问题,不过这个命令是要依赖从库配置report_host, report_port等参数才能上报的,要不然执行这个命令出来就是个空列表。不在意从库的延迟监控的话就直接指定为none好了
--max-lag
type: time; default: 1s
每复制完一块数据后,工具会去检查从库的延迟,如果从库延迟超过这个值,那就暂停,等从库延迟追上再开始复制
--check-slave-lag
type: DSN
不用--recursion-method的话就用这个参数来指定一个从库监控,格式是DSN,如果指定了该参数,则--recursion-method就不起作用了
示例
pt-online-schema-change --no-version-check --print --progress time,5 --recursion-method none --alter "ADD COLUMN status TINYINT(2) NOT NULL DEFAULT 1" --ask-pass h=your_host,P=3306,u=your_username,D=your_database_name,t=your_table_name,A=utf8