Rsync是一款开源的、快速的、多功能的、可实现全量及增量的本地或远程数据同步备份的优秀工具,并且可以不进行改变原有数据的属性信息,实现数据的备份迁移特性。
Rsync软件适用于unix/linux/windows等多种操作系统平台。支持本地复制,或者与其他SSH,Rsync主机同步。
rsync第一次会全量传输,后续会对比两个文件的不同,只传输文件更新的部分,传输速度比一般工具快。
rsync与cp、scp对比
cp命令是一种典型的将文件完整的拷贝到一个位置。而rsync是,第一次拷贝,在目标位置没有的时候,rsync是全量拷贝过去,但是第二次拷贝的时候,只会对差异项进行同步拷贝。所有如果对同一个文件进行二次备份的话,rsync速度会相较于cp而言更快。
cp只支持本地,而rsync支持远程
scp是基于cp原理,也是属于完整性拷贝文件。假设rsync和scp拷贝的文件都是第一,目标地址都没有要同步的文件,此时,这两者的差异在于,第一个,这个要传输的文件大不大,第二个要看在传输的过程中,用的带宽大不大。如果文件不大的情况下,scp是把数据从磁盘中的块存储提取出来,封装一下,网络传过去,此时scp更快。如果是更大的文件,scp想要传输,需要拆分数据,一段一段传输。而rsync会根据一个逻辑意义上的空间,把数据划分出来,把数据先压缩再传输,所以这种方式而言,带宽校,文件大,这个时候先压缩再传输会比较快。此时适合用rsync远程同步。
rsync监听端口: 873 rsync运行模式: c/s
在远程同步任务中,负责发起 rsync 同步操作的客户机称为发起端,而负责响应来自客户机的 rsync 同步操作的服务器称为同步源。
rsync同步源
rsync同步源:指备份操作的远程服务器,也称备份源。
下行同步:下行同步是将文件从远程或源端同步到本地或目标端。
在下行同步(下载)中,同步源负责提供文档的原始位置,发起端应对该位置有读取权限。
上行同步:上行同步是将文件从本地或源端同步到远程或目标端。
在上行同步(上传)中,同步源负责提供文档的目标位置,发起端应对该位置具有写入权限。
适用语法:rsync [选项] 原始位置 目标位置
常用选项:
-r 递归模式,包含目录及子目录中的所有文件
-l 对于符号链接文件仍然复制为符号链接文件
-v 显示同步过程的详细信息
-z 在传输文件时进行压缩
-a 归档模式,保留文件的权限、属性等信息,等同于组合选项”-rlptgoD“
-p 保留文件的权限标记
-t 保留文件的时间标记
-g 保留文件的数组标记 (仅超级用户使用)
-o 保留文件的属主标记(仅超级用户使用)
-H 保留硬链接文件
-A 保留ACL属性信息
-D 保留设备文件及其他特殊文件
–delete 删除目标位置有而原始位置没有的文件
–checksum 根据校验和(而不是文件大小,修改时间)来决定是否跳过文件
--progress 显示备份过程
配置源的两种表达方法
格式一:
用户名@主机地址::共享模块名
rsync -avz user_name@192.168.209.22::www /opt/
格式二:
rsync://用户名@主机地址/共享模块名
rsync -avz rsync://user_name@192.168.209.22/www /opt/
实验环境
准备两台机器
角色 | 主机 | |
---|---|---|
master-A | 192.168.209.168 | |
master-B | 192.168.209.169 |
将master-A上面的数据实时的同步到master—B上面去做到异地备份
先操作目标主机
[root@master-b ~]# rpm -qa | grep rsync
[root@master-b ~]# yum provides rsync
[root@master-b ~]# yum install -y rsync-3.1.2-12.el7_9.x86_64
[root@master-b ~]# mv /etc/rsyncd.conf /etc/rsyncd.conf.bak
[root@master-b ~]# vim /etc/rsyncd.conf
log file = /var/log/rsyncd.log
pidfile = /var/run/rsyncd.pid
lock file = /var/run/rsync.lock
secrets file = /etc/rsync.pass #用户的认证文件
[data] #共享模块的名称,rsync默认调用该模块,默认调用的路径是该模块指定的路径,自己定义
path = /var/lib/mysql ##需要同步的目录(准确的说是同步过来后放到哪里的目录路径)
auth users = jack #执行数据同步的用户名,可以设置多个,用>英文状态下逗号隔开(认证用户)
uid = root #工作中指定用户(可以不指定为0)
gid = root #工作中指定用户(可以不指定为0)
port = 873 #默认端口号为873
ignore errors #表示出现错误忽略错误
use chroot = yes #开启,禁锢在源目录,表示允许在访问我备份的目录或文件的时候,使用的角色是root,同时你访问本地目录时拥有的也是root权限
read only = no #关闭只读模式,否则将不可写入
max connections = 200 #有多少个客户端同时传文件
timeout = 300 #超时时间
hosts allow = 192.168.209.0/24 #允许进行数据同步的客户端IP地址或者网络,
可以设置多个,用英文状态下逗号隔开,类似黑白名单
创建认证用户
[root@master-b ~]# useradd jack
[root@master-b ~]# passwd jack
Changing password for user jack.
New password:
BAD PASSWORD: The password is shorter than 8 characters
Retype new password:
passwd: all authentication tokens updated successfully.
创建用户认证文件
[root@master-b ~]# cat /etc/rsync.pass
jack:123456 #格式,用户名:密码,可以设置多个,每行一个用户名:密码
设置文件权限
[root@master-b ~]# chmod 600 /etc/rsync.pass
[root@master-b ~]# chmod 600 /etc/rsyncd.conf
[root@master-b ~]# systemctl start rsyncd
[root@master-b ~]# systemctl enable rsyncd
在源机器上面操作
[root@master-a ~]# rpm -qa | grep rsync
[root@master-a ~]# yum install -y rsync-3.1.2-12.el7_9.x86_64
[root@master-a ~]# vim /etc/rsync.password #整个文件需要600的权限和服务端rsync同步用户的密码,这里是服务器端jack用户的密码
[root@master-a ~]# cat /etc/rsync.password
123456
[root@master-a ~]# chmod 600 /etc/rsync.password
[root@master-a ~]# systemctl start rsyncd
[root@master-a ~]# systemctl enable rsyncd
测试
[root@master-a ~]# mysql -uroot -p'QianFeng@123!'
mysql> create database db2;
Query OK, 1 row affected (0.00 sec)
mysql> show databases;
+--------------------+
| Database |
+--------------------+
| information_schema |
| db1 |
| db2 |
| db4 |
| mysql |
| performance_schema |
| sys |
+--------------------+
7 rows in set (0.00 sec)
mysql> \q
[root@master-a ~]# rsync -arvH --port=873 --delete --progress /var/lib/mysql/* jack@192.168.209.169::data --password-file=/etc/rsync.password
验证
[root@master-b mysql]# fg
mysql -uroot -p'QianFeng@123!'
mysql> show databases;
+--------------------+
| Database |
+--------------------+
| information_schema |
| db1 |
| db2 |
| db4 |
| mysql |
| performance_schema |
| sys |
+--------------------+
7 rows in set (0.00 sec)
以上rsync同步成功!下面结合inotify实现实时同步。
inotify简介
监控文件系统的变动情况,并做出通知响应
在源服务器上面执行
安装Inotify-tools工具,实时触发rsync进行同步,查看服务器内核是否支持inotify
实时同步的优点
一旦同步源出现变化,立即启动备份
只要同步源无变化,则不执行备份
[root@master-a ~]# ll /proc/sys/fs/inotify/
total 0
-rw-r--r-- 1 root root 0 Jul 28 21:03 max_queued_events
-rw-r--r-- 1 root root 0 Jul 28 21:03 max_user_instances
-rw-r--r-- 1 root root 0 Jul 28 21:03 max_user_watches
#列出文件目录,出现下面的内容,说明服务器内核支持inotify,注:Linux下支持inotify的内核最小为2.6.13
[root@master-a ~]# rpm -qa inotify-tools
[root@master-a ~]# wget -O /etc/yum.repos.d/epel.repo http://mirrors.aliyun.com/repo/epel-7.repo #安装阿里扩展源
[root@master-a ~]# yum install -y inotify-tools
查看inotify安装上的两个命令(inotifywait,inotifywatch)
[root@master-a ~]# rpm -ql inotify-tools
/usr/bin/inotifywait
/usr/bin/inotifywatch
...
科普:
inotifywait和inotifywatch的作用:
一共安装了2个工具(命令),即inotifywait和inotifywatch
inotifywait : 可监控modify(修改)、create(创建)、move(移动)、delete(删除)、attrib(属性更改)等各种事件,一有变动立即输出结果
执行后处于阻塞状态,适合在shell脚本中使用
inotifywatch :收集被监控的文件系统使用的统计数据,指文件系统事件发生的次数统计。
修改inotify默认参数(inotify默认内核参数值太小)
我们在/proc/sys/fs/inotify这个目录下看到有三个文件,这三个文件就是记录inotify的内核参数的文件。其中max_queued_events这个文件记录inotify事件队列最大长度,如值太小会报Event Queue Overflow 错误,默认值:16384,当然这个值是可以更改的,临时更改可以用echo 命令加上值给重定向到这个文件中。永久修改需要修改编辑/etc/sysctl.conf
文件 | 默认值 | 作用说明 |
---|---|---|
max_user_watches | 8192 | 设置inotifywait或inotifywatch命令可以监视的文件数量(单进程) |
max_user_instances | 128 | 设置每个用户可以运行的inotifywait或inotifywatch命令的进程数 |
max_queued_events | 16384 | 设置inotify实例事件(event)队列可容纳的事件数量 |
修改参数:
[root@master-a ~]# vim /etc/sysctl.conf
fs.inotify.max_queued_events=99999999
fs.inotify.max_user_watches=99999999
fs.inotify.max_user_instances=65535
[root@master-a ~]# sysctl -p
参数说明:
max_queued_events:
inotify队列最大长度,如果值太小,会出现"** Event Queue Overflow **"错误,导致监控文件不准确
max_user_watches:
要同步的文件包含多少目录,可以用:find /home_test -type d | wc -l 统计,必须保证max_user_watches值大于统
计结果(这里/home_test为同步文件目录)
max_user_instances:
每个用户创建inotify实例最大值
编写脚本
[root@master-a sync-inotify]# pwd
/root/sync-inotify
[root@master-a sync-inotify]# vim inotify.sh
#!/bin/bash
Path="/var/lib/mysql/"
backup_Server="192.168.209.169"
#excludedir="/root/exclude.list"
user="jack"
pass_file="/etc/rsync.password"
module="data"
/usr/bin/inotifywait -mrq -e create,modify,delete,close_write $Path | while read line
do
if [ -f $line ];then
/usr/bin/rsync -arH --port=873 --delete --progress $line $user@$backup_Server::$module --password-file=$pass_file
else
cd /var/lib/mysql &&\
/usr/bin/rsync -arH --port=873 ./ --delete --progress $user@$backup_Server::$module --password-file=$pass_file
fi
done
[root@master-a sync-inotify]# crontab -l
*/1 * * * * /bin/bash /root/sync-inotify/inotify.sh >/dev/null 2>&1 &
脚本参数解释
rsync -azH $line --delete --progress --exclude-from=$excludedir $user@$backup_Server::$module --password-file=$pass_file
脚本参数参数详解:
excludedir=/root/exclude.list #不需要同步的目录,如果有多个,每一行写一个目录,使用相对于同步模块的路径;
#例如:不需要同步/home_test目录下的a目录和b目录下面的b1目录,exclude.list文件可以这样写
a/
b/b1/
inotify参数
-m 是保持一直监听
-r 是递归查看目录
-q 是打印出事件
-e create,move,delete,modify,attrib 是指 “监听 创建 移动 删除 写入 权限” 事件
--exclude-from=FILE 排除FILE中指定模式的文件
测试:
更多的rsync参数
-v, --verbose 详细模式输出
-q, --quiet 精简输出模式
-c, --checksum 打开校验开关,强制对文件传输进行校验
-a, --archive 归档模式,表示以递归方式传输文件,并保持所有文件属性,等于-rlptgoD
-r, --recursive 对子目录以递归模式处理
-R, --relative 使用相对路径信息
-b, --backup 创建备份,也就是对于目的已经存在有同样的文件名时,将老的文件重新命名为~filename。可以使用--suffix选项来指定不同的备份文件前缀。
--backup-dir 将备份文件(如~filename)存放在在目录下。
-suffix=SUFFIX 定义备份文件前缀
-u, --update 仅仅进行更新,也就是跳过所有已经存在于DST,并且文件时间晚于要备份的文件。(不覆盖更新的文件)
-l, --links 保留软链结
-L, --copy-links 想对待常规文件一样处理软链结
--copy-unsafe-links 仅仅拷贝指向SRC路径目录树以外的链结
--safe-links 忽略指向SRC路径目录树以外的链结
-H, --hard-links 保留硬链结
-p, --perms 保持文件权限
-o, --owner 保持文件属主信息
-g, --group 保持文件属组信息
-D, --devices 保持设备文件信息
-t, --times 保持文件时间信息
-S, --sparse 对稀疏文件进行特殊处理以节省DST的空间
-n, --dry-run现实哪些文件将被传输
-W, --whole-file 拷贝文件,不进行增量检测
-x, --one-file-system 不要跨越文件系统边界
-B, --block-size=SIZE 检验算法使用的块尺寸,默认是700字节
-e, --rsh=COMMAND 指定使用rsh、ssh方式进行数据同步
--rsync-path=PATH 指定远程服务器上的rsync命令所在路径信息
-C, --cvs-exclude 使用和CVS一样的方法自动忽略文件,用来排除那些不希望传输的文件
--existing 仅仅更新那些已经存在于DST的文件,而不备份那些新创建的文件
--delete 删除那些DST中SRC没有的文件
--delete-excluded 同样删除接收端那些被该选项指定排除的文件
--delete-after 传输结束以后再删除
--ignore-errors 及时出现IO错误也进行删除
--max-delete=NUM 最多删除NUM个文件
--partial 保留那些因故没有完全传输的文件,以是加快随后的再次传输 #断点续传
--force 强制删除目录,即使不为空
--numeric-ids 不将数字的用户和组ID匹配为用户名和组名
--timeout=TIME IP超时时间,单位为秒
-I, --ignore-times 不跳过那些有同样的时间和长度的文件
--size-only 当决定是否要备份文件时,仅仅察看文件大小而不考虑文件时间
--modify-window=NUM 决定文件是否时间相同时使用的时间戳窗口,默认为0
-T --temp-dir=DIR 在DIR中创建临时文件
--compare-dest=DIR 同样比较DIR中的文件来决定是否需要备份
-P 等同于 --partial
--progress 显示备份过程
-z, --compress 对备份的文件在传输时进行压缩处理
--exclude=PATTERN 指定排除不需要传输的文件模式
--include=PATTERN 指定不排除而需要传输的文件模式
--exclude-from=FILE 排除FILE中指定模式的文件
--include-from=FILE 不排除FILE指定模式匹配的文件
--version 打印版本信息
--address 绑定到特定的地址
--config=FILE 指定其他的配置文件,不使用默认的rsyncd.conf文件
--port=PORT 指定其他的rsync服务端口
--blocking-io 对远程shell使用阻塞IO
-stats 给出某些文件的传输状态
--progress 在传输时现实传输过程
--log-format=formAT 指定日志文件格式
--password-file=FILE 从FILE中得到密码
--bwlimit=KBPS 限制I/O带宽,KBytes per second
-h, --help 显示帮助信息