目录
正确、有效的备份方案是保障系统及数据安全的重要手段。在服务器中,通常会结合计划任务、Shell 脚本来执行本地备份。为了进一步提高备份的可靠性,使用异地备份也是非常有必要的。
本章将要学习 rsync 工具的使用,以实现快速、安全、高效的异地备份,如针对 Web 站点的同步备份。
一、配置 rsync 源服务器
rsync(Remote Sync,远程同步)是一个开源的快速备份工具,可以在不同主机之间镜像同步整个目录树,支持增量备份,并保持链接和权限,且采用优化的同步算法,传输前 执行压缩,因此非常适用于异地备份、镜像服务器等应用。
rsync 的官方站点的网址是 http://rsync.samba.org/,目前最新版本是 3.1.3,由 Wayne Davison 进行维护。作为一种最常用的文件备份工具,rsync 往往是 Linux 和 UNIX 系统默 认安装的基本组件之一。本章以 CentOS 7.3 系统中的 rsync-3.0.9-17 为例,进行相关操作演示。
[root@rsync ~]# rpm -q rsync
rsync-3.1.2-10.el7.x86_64
在远程同步任务中,负责发起 rsync 同步操作的客户机称为发起端,而负责响应来自客户机的 rsync 同步操作的服务器称为同步源。在同步过程中,同步源负责提供文件的原始位置,发起端应对该位置具有读取权限,如下图所示。
rsync同步示意图
下面介绍如何配置 rsync 同步源。
rsync 作为同步源时以守护进程运行,为其他客户机提供备份源。配置 rsync 同步源需要建立配置文件 rsyncd.conf,创建备份账号,然后将 rsync 程序以守护进程(“--daemon” 选项)方式运行
实验环境如下:
主机 | 操作系统 | 主机名/IP地址 |
rsync 同步源 | centos7.9 | rsync 192.168.23.208 |
rsync 客户端 | centos7.9 | client 192.168.23.209 |
1、建立 /etc/rsyncd.conf 配置文件
配置文件 rsyncd.conf 位于/etc 目录下。下面将以源目录/var/www/html、备份账号 backuper 为例,介绍其配置方法。
[root@rsync ~]# vim /etc/rsyncd.conf
uid = nobody
gid = nobody
use chroot = yes //禁锢在源目录
max connections = 4 //最大连接数
pid file = /var/run/rsyncd.pid //存放进程 ID 的文件位置
log file /var/log/rsyncd.log //日志文件位置
dont compress = *.gz *.tgz *.zip *.z *.Z *.rpm *.deb *.bz2 //同步时不在压缩的文件类型
address = 192.168.23.208 //监听地址
port = 873 //监听端口
hosts allow = 192.168.23.0/24 //允许访问的客户机地址
[wwwroot] //共享模块名称
path = /var/www/html //源目录的实际路径
read only =yes //是否为只读
auth users = backuper //授权账户
secrets file = /etc/rsyncd_users.db //存放账户信息的数据文件
基于安全性考虑,对于 rsync 的同步源最好仅允许以只读方式做同步。另外,同步可以采用匿名的方式,只要将其中的“auth users”和“secrets file”配置记录去掉就可以了。
2、为备份账户创建数据文件
根据上一步的设置,创建账号数据文件,并添加一行用户记录,以冒号分隔,用户名称为“backuper”,密码为“cisco@123”。由于账号信息采用明文存放,因此,需要调整文件权限, 以避免账号信息泄露。
[root@rsync ~]# vim /etc/rsyncd_users.db
backuper:cisco@123
[root@rsync ~]# chmod 600 /etc/rsyncd_users.db
备份用户 backuper 需要对源目录/var/www/html 有相应的读取权限。实际上只要 other 组有读取权限,则备份用户 backuper 和运行用户 nobody 也就有读取权限了。
[root@rsync ~]# mkdir -p /var/www/html
[root@rsync ~]# ls -ld /var/www/html/
drwxr-xr-x 2 root root 6 3月 25 15:06 /var/www/html/
3、启动 rsync 服务程序
上述操作完成以后,执行“rsync --daemon”命令就可以启动 rsync 服务,以独立监听服务的方式运行。若要关闭 rsync 服务,可以采取 kill 进程的方式,如:kill $(cat /var/run/rsyncd.pid)。然后删除 pid 进程文件即可。
[root@rsync ~]# rsync --daemon
[root@rsync ~]# ss -anpt | grep rsync
LISTEN 0 5 192.168.23.208:873 *:* users:(("rsync",pid=2306,fd=3))
二、使用 rsync 备份工具
有了同步源服务器之后,就可以使用 rsync 工具来执行远程同步了。本节介绍的备份操作均在客户机(发起端)执行。实际上,同步源与发起端可以是同 一台主机(当然这种情况不常见),其效果相当于本地备份而不是异地备份。
1、rsync 命令的基本用法
绝大多数的备份程序要求指定原始位置、目标位置,rsync 命令也一样。最简单的 rsync 用法类似于 cp 命令。例如,可以将文件/etc/fstab、目录/boot/grub 同步备份到/opt 目录下,其中“-r”选项表示递归整个目录树,“-l”选项用来备份链接文件。
[root@rsync ~]# rsync /etc/fstab /opt/
[root@rsync ~]# rsync -rl /etc/fstab /boot/grub /opt/
[root@rsync ~]# ls /opt/
fstab grub
1)命令格式及常用备份选项
从以上操作可以看出,备份的基本格式为“rsync [选项] 原始位置 目标位置”,其中常用的一些命令选项如下所示,具体应根据实际需求选择(如-avz)。
- -r:递归模式,包含目录及子目录中的所有文件。
- -l:对于符号链接文件仍然复制为符号链接文件。
- -v:显示同步过程的详细(verbose)信息。
- -a:归档模式,保留文件的权限、属性等信息,等同于组合选项“-rlptgoD”。
- -z:在传输文件时进行压缩(compress)。
- -p:保留文件的权限标记。
- -t:保留文件的时间标记。
- -g:保留文件的属组标记(仅超级用户使用)。
- -o:保留文件的属主标记(仅超级用户使用)。
- -H:保留硬连接文件。
- -A:保留 ACL 属性信息。
- -D:保留设备文件及其他特殊文件。
- --delete:删除目标位置有而原始位置没有的文件。
- --checksum:根据校验和(而不是文件大小、修改时间)来决定是否跳过文件。
2)配置源的表示方法
在执行远程同步任务时,rsync 命令需要指定同步源服务器中的资源位置。rsync 同步源的资源表示方式为:
用户名@主机地址::共享模块名”
或者
“rsync://用户名@主机地址/共享 模块名
前者为两个冒号分隔形式,后者为 URL 地址形式。
例如,执行以下操作即可访问 rsync 同步源,将指定的资源下载到本地/root 目录下进行备份。
[root@client ~]# rsync -avz backuper@192.168.23.208::wwwroot /root
或者
[root@client ~]# rsync -avz rsync://backuper@192.168.23.208/wwwroot /root
2、rsync 备份操作示例
执行以下操作将访问源服务器中的 wwwroot 共享模块,并下载到本地的/myweb 目录下。
[root@client ~]# mkdir /myweb
[root@client ~]# rsync -avz backuper@192.168.23.208::wwwroot /myweb
Password: //验证 backuper 用户的密码
receiving incremental file list
./
1.txt
sent 46 bytes received 101 bytes 10.14 bytes/sec
total size is 0 speedup is 0.00
[root@client ~]# ls /myweb/ //确认同步结果
1.txt
实际生产环境中的备份工作通常是按计划重复执行的。例如每天晚上 22∶30 对服务器 的网站目录做一次同步,定期任务可以交给 crond 服务来完成。
为了在同步过程中不用输入密码,需要创建一个密码文件,保存 backuper 用户的密码, 如/etc/server.pass。在执行 rsync 同步时使用选项“--password-file=/etc/server.pass”指定即可。
[root@client ~]# vim /etc/server.pass
cisco@123
[root@client ~]# chmod 600 /etc/server.pass
[root@client ~]# crontab -e
30 22 * * * /usr/bin/rsync -az --delete --password-file=/etc/server.pass backuper@192.168.23.208::wwwroot /myweb //每天22.30执行脚本
[root@client ~]# systemctl restart crond
[root@client ~]# systemctl enable crond
三、配置 inotify+rsync 实时同步
Linux 内核从 2.6.13 版本开始提供了 inotify 通知接口,用来监控文件系统的各种变化情 况,如文件存取、删除、移动、修改等。利用这一机制,可以非常方便地实现文件异动告警、 增量备份,并针对目录或文件的变化及时作出响应。
将 inotify 机制与 rsync 工具相结合,可以实现触发式备份(实时同步)——只要原始位置的文档发生变化,则立即启动增量备份操作;否则处于静默等待状态,如下图所示。这样,就避免了按固定周期备份时存在的延迟性、周期过密等问题。
inotify+rsync 触发式上行同步
正因为 inotify 通知机制由 Linux 内核提供,因此主要做本机监控,在触发式备份中应用时更适合上行同步。下面依次介绍其配置过程。
将第一个实验的两台主机快照恢复,实验环境如下:
主机 | 操作系统 | 主机名/IP地址 |
rsync 同步源 | centos7.9 | rsync 192.168.23.208 |
rsync 客户端 | centos7.9 | client 192.168.23.209 |
同步源配置:
[root@rsync ~]# vim /etc/rsyncd.conf
uid = root
gid = root
use chroot = yes
max connections = 4
pid file = /var/run/rsyncd.pid
log file /var/log/rsyncd.log
dont compress = *.gz *.tgz *.zip *.z *.Z *.rpm *.deb *.bz2
address = 192.168.23.208
port = 873
hosts allow = 192.168.23.0/24
[wwwroot]
path = /var/www/html
read only = no
#auth users = root
#wwqsecrets file = /etc/rsyncd_user.db
[root@rsync ~]# useradd backuper
[root@rsync ~]# passwd backuper
更改用户 backuper 的密码 。
新的 密码:
无效的密码: 密码未通过字典检查 - 它基于字典单词
重新输入新的 密码:
passwd:所有的身份验证令牌已经成功更新。
[root@rsync ~]# mkdir -p /var/www/html
[root@rsync ~]# chmod 777 /var/www/html
[root@rsync ~]# ls -ld /var/www/html/
drwxrwxrwx 2 root root 6 3月 25 16:51 /var/www/html/
[root@rsync ~]# rsync --daemon
[root@rsync ~]# ss -anpt | grep rsync
LISTEN 0 5 192.168.23.208:873 *:* users:(("rsync",pid=2296,fd=3))
客户端配置:
1、调整 inotify 内核参数
在 Linux 内核中,默认的 inotify 机制提供了三个调控参数:max_queue_events、 max_user_instances、max_user_watches,分别表示监控事件队列(16 384)、最多监控实例数(128)、每个实例最多监控文件数(8192)。
[root@client ~]# cat /proc/sys/fs/inotify/max_queued_events
16384
[root@client ~]# cat /proc/sys/fs/inotify/max_user_instances
128
[root@client ~]# cat /proc/sys/fs/inotify/max_user_watches
8192
当要监控的目录、文件数量较多或者变化较频繁时,建议加大这三个参数的值。例如,可直接修改/etc/sysctl.conf 配置文件,将管理队列设为 32768,实例数设为 1024,监控数设为 1048576,通常情况下监控数所设的值建议大于监控目标的总文件数。
[root@client ~]# vim /etc/sysctl.conf
......//省略部分内容
fs.inotify.max_queued_events = 16384
fs.inotify.max_user_instances = 1024
fs.inotify.max_user_watches = 1048576
[root@client ~]# sysctl -p
2、安装 inotify-tools 工具
使用 inotify 机制还需要安装 inotify-tools,以便提供 inotifywait、inotifywatch 辅助工具程序,用来监控、汇总改动情况。inotify-tools 可从网站 https://github.com/rvoicilas/inotify-tools/releases 下载,版本为 3.14。
[root@client ~]# tar zxf inotify-tools-3.14.tar.gz
[root@client ~]# cd inotify-tools-3.14
[root@client inotify-tools-3.14]# ./configure
[root@client inotify-tools-3.14]# make && make install
以监控网站目录/myweb为例,可以先执行“inotifywait”命令,然后另外打开一个终端向/myweb 目录下添加文件、移动文件,跟踪屏幕输出结果。其中,选项“-e”用来指 定要监控哪些事件,选项“-m”表示持续监控,选项“-r”表示递归整个目录,选项“-q”简化输出信息。
[root@client ~]# mkdir /myweb
[root@client ~]# inotifywait -mrq -e modify,create,move,delete /myweb
/myweb/ CREATE 1.txt
/myweb/ MOVED_FROM 1.txt
/myweb/ MOVED_TO 2.txt
/myweb/ DELETE 2.txt
inotifywait 可监控 modify(修改)、create(创建)、move(移动)、delete(删除)、 attrib(属性更改)等各种事件,一有变动立即输出结果;inotifywatch 可用来收集文件系统变动情况,并在运行结束后输出汇总的变化情况。关于这两个命令的详细用法可以参考其 man 手册页,配置触发备份任务时只要用到 inotifywait 就可以了。
[root@client ~]# mkdir /myweb
[root@client ~]# vim /etc/server.pass
cisco@123
[root@client ~]# chmod 600 /etc/server.pass
[root@client ~]# vim /opt/inotify_rsync.sh
#!/bin/bash
INOTIFY_CMD="inotifywait -mrq -e modify,create,move,delete /myweb"
RSYNC_CMD="rsync -az --delete --password-file=/etc/server.pass /myweb/ root@192.168.23.208::wwwroot"
$INOTIFY_CMD | while read DIRECTORY EVENT FILE //一旦读取到$INOTIFY_CMD 命令的输出结果就执行 do 后面的语句
do
$RSYNC_CMD
done
[root@client ~]# chmod +x /opt/inotify_rsync.sh
[root@client ~]# echo 'sh /opt/inotify_rsync.sh' >> /etc/rc.local //设置脚本开机自启
[root@client ~]# sh /opt/inotify_rsync.sh & //启动脚本的时候后面加一个&符号可以后台启动
上述脚本用来检测本机/myweb 目录的变动情况,一旦有更新触发 rsync 同步操作,上传备份至服务器 192.168.23.208 的/var/www/html 目录下。
触发式上行同步的验证过程如下所述,具体操作不再赘述。
- 在本机运行/opt/inotify_rsync.sh 脚本程序。
- 切换到本机的/myweb 目录,执行增加、删除、修改文件等操作。
- 查看服务器中的/var/www/html 目录下的变化情况。
总结:
下行同步:是将数据放在同步源,客户端请求同步源同步数据
上行同步:是将数据放在客户端,如果客户端数据有变动将通过inotify+rsync将数据同步给同步源