前言:
1、为什么要用Rsync+sersync架构?
sersync是基于Inotify开发的,类似于Inotify-tools的工具
sersync可以记录下被监听目录中发生变化的(包括增加、删除、修改)具体某一个文件或某一个目录的名字,然后使用rsync同步的时候,只同步发生变化的这个文件或者这个目录。
2、Rsync+Inotify-tools与Rsync+sersync这两种架构有什么区别?
Rsync+Inotify-tools
(1)Inotify-tools只能记录下被监听的目录发生了变化(包括增加、删除、修改),并没有把具体是哪个文件或者哪个目录发生了变化记录下来;
(2)rsync在同步的时候,并不知道具体是哪个文件或者哪个目录发生了变化,每次都是对整个目录进行同步,当数据量很大时,整个目录同步非常耗时(rsync要对整个目录遍历查找对比文件),因此,效率很低。
Rsync+sersync
(1)sersync可以记录下被监听目录中发生变化的(包括增加、删除、修改)具体某一个文件或某一个目录的名字;
(2)rsync在同步的时候,只同步发生变化的这个文件或者这个目录(每次发生变化的数据相对整个同步目录数据来说是很小的,rsync在遍历查找比对文件时,速度很快),因此,效率很高。
小结:当同步的目录数据量不大时,建议使用Rsync+Inotify-tools;当数据量很大(几百G甚至1T以上)、文件很多时,建议使用Rsync+sersync。
部署说明:
操作系统:CentOS 7.4
源服务器:192.168.74.137 (Sersync+web)(Master 作为主发布服务器)
目标服务器: 192.168.74.138、192.168.74.139(Rsync+web)(此处可逐步增加集群的slave)
目的:
把源服务器上/work/admin/data 目录实时同步到目标服务器的/work/admin/data 下
具体操作:
3、安装Rsync服务端
分别在两台目标服务器192.168.74.138/139上操作
3.1 关闭SELINUX
1 | [admin@haifly-bj-static1 ~]$ sudo vim /etc/selinux/config |
3.2 开启防火墙tcp 873端口(Rsync默认端口)
1 | [admin@haifly-bj-static1 ~]$ sudo vim /etc/sysconfig/iptables #编辑防火墙配置文件 |
3.3 安装Rsync服务端软件
1 | [admin@haifly-bj-static1 ~]$ wget https://download.samba.org/pub/rsync/rsync-3.1.3.tar.gz |
3.4 修改rsyncd.conf配置文件
1 | [admin@haifly-bj-static1 ~]$ mkdir /work/admin/rsync/conf |
log file =/work/admin/rsync/rsyncd.log #日志文件位置,启动rsync后自动产生这个文件,无需提前创建
pidfile =/work/admin/rsync/rsyncd.pid #pid文件的存放位置
lock file =/work/admin/rsync/rsync.lock #支持max connections参数的锁文件
secretsfile =/work/admin/rsync/rsync.passwd #用户认证配置文件,里面保存用户名称和密码,后面会创建这个文件
motd file =/etc/rsyncd.Motd #rsync启动时欢迎信息页面文件位置(文件内容自定义)
[Sync] #自定义名称
path = /work/admin/data/ #rsync服务端数据目录路径
comment = static #模块名称与[md]自定义名称相同
uid = admin #设置rsync运行权限为admin
gid = admin #设置rsync运行权限为admin
port=873 #默认端口
use chroot= no #默认为true,修改为no,增加对目录文件软连接的备份
read only =no #设置rsync服务端文件为读写权限
list = no #不显示rsync服务端资源列表
maxconnections = 200 #最大连接数
timeout =600 #设置超时时间
auth users= admin #执行数据同步的用户名,可以设置多个,用英文状态下逗号隔开
hosts allow= 192.168.74.137 #允许进行数据同步的客户端IP地址,可以设置多个,用英文状态下逗号隔开
hosts deny= * #禁止数据同步的客户端IP地址,可以设置多个,用英文状态下逗号隔开
:wq! #保存,退出(贴进配置文件将中文去掉,否则可能造成无法识别模块)
3.5 创建用户认证文件,data数据存储目录
配置文件,添加以下内容,添加允许传输用户和密码
1 | [admin@haifly-bj-static1 ~]$ vim /work/admin/rsync/conf/rsync.passwd |
3.6 设置文件权限
1 | [admin@haifly-bj-static1 ~]$ chmod 600 /work/admin/rsync/conf/rsync.passwd |
3.7 配置rsync服务启动
1 | [admin@haifly-bj-static1 ~]$ sudo vim /etc/systemd/system/rsyncd.service |
3.8 启动rsync 服务端
1 | [admin@haifly-bj-static1 ~]$ sudo ln -s /work/admin/rsync/conf/rsyncd.conf /etc/rsyncd.conf |
4、安装Rsync客户端
在源服务器192.168.74.137上操作
4.1 关闭SELINUX
1 | [admin@haifly-bj-manage1 ~]$ sudo vim /etc/selinux/config |
4.2 安装Rsync客户端端软件
1 | [admin@haifly-bj-manage1 ~]$ wget https://download.samba.org/pub/rsync/rsync-3.1.3.tar.gz |
或者可以使用yum安装,客户端不需要启动rsync也不需要修改配置文件
4.3 创建认证密码文件
1 | 编辑文件,添加以下内容,该密码应与目标服务器中的/work/admin/rsync/conf/rsync.passwd中的密码一致 |
4.4 测试源服务器192.168.74.137到目标服务器 192.168.74.138/139之间的数据同步
1 | [admin@haifly-bj-manage1 ~]$ mkdir -p /work/admin/data/ceshi #在源服务器上创建测试文件夹,然后在源服务器运行下面1行命令 |
5、安装sersync工具,实时触发rsync进行同步
5.1 查看服务器内核是否支持inotify
1 | [admin@haifly-bj-manage1 ~]$ ll /proc/sys/fs/inotify #列出文件目录,出现下面的内容,说明服务器内核支持inotify |
备注:Linux下支持inotify的内核最小为2.6.13,可以输入命令:#uname -a查看内核
CentOS 7.4内核为3.10.0,默认已经支持inotify
5.2 修改inotify默认参数(inotify默认内核参数值太小)
1 | 查看系统默认参数值: |
参数说明:
max_queued_events:
inotify队列最大长度,如果值太小,会出现”** Event QueueOverflow **”错误,导致监控文件不准确
max_user_watches:
要同步的文件包含多少目录,可以用:find /home/Sync-type d | wc -l 统计,必须保证max_user_watches值大于统计结果(这里/home/Sync为同步文件目录)
max_user_instances:
每个用户创建inotify实例最大值
5.3 安装sersync
1 | sersync下载地址:https://storage.googleapis.com/google-code-archive-downloads/v2/code.google.com/sersync/sersync2.5.4_64bit_binary_stable_final.tar.gz |
5.4 配置sersync
1 | [admin@haifly-bj-manage1 downloads]$ cd /work/admin/sersync |
参数说明:
localpath watch=”/work/admin/data/“:#源服务器同步目录
remote ip=”192.168.74.138”:#目标服务器IP地址
name=”static”: #目标服务器rsync同步目录模块名称
users=”admin”: #目标服务器rsync同步用户名
passwordfile=”/work/admin/rsync/rsync.passwd”: #目标服务器rsync同步用户的密码在源服务器的存放路径
failLogpath=”/work/admin/rsync/rsync_fail_log.sh” #脚本运行失败日志记录
start=“true” #设置为true,每隔600分钟执行一次全盘同步
5.5 设置sersync监控开机自动执行
编辑rc.local,在最后添加一行
1 | [admin@haifly-bj-manage1 downloads]$ sudo vim /etc/rc.d/rc.local |
5.6 添加脚本监控sersync
1 | [admin@haifly-bj-manage1 downloads]$ mkdir /work/admin/crontab/ |
5.6 测试sersync实时触发rsync同步脚本是否正常运行
在源服务器192.168.74.137上创建文件inotify_rsync_ceshi
1 | [admin@haifly-bj-manage1 downloads]$ mkdir /work/admin/data/inotify_rsync_ceshi |
重新启动源服务器:192.168.74.137
等系统启动之后,查看两台目标服务器 192.168.74.138/139的/work/admin/data/下是否有inotify_rsync_ceshi文件夹。
然后再在源服务器192.168.74.137创建文件夹inotify_rsync_ceshi_new
1 | [admin@haifly-bj-manage1 downloads]$ touch /work/admin/data/inotify_rsync_ceshi_new |
继续查看两台目标服务器 192.168.74.138/139的/work/admin/data下是否有inotify_rsync_ceshi_new文件。
如果以上测试都通过,说明inotify实时触发rsync同步脚本运行正常。
至此,Linux下Rsync+sersync实现数据实时同步完成。
扩展阅读:
rsync参数
-v, –verbose 详细模式输出
-q, –quiet 精简输出模式
-c, –checksum 打开校验开关,强制对文件传输进行校验
-a, –archive 归档模式,表示以递归方式传输文件,并保持所有文件属性,等于-rlptgoD
-r, –recursive 对子目录以递归模式处理
-R, –relative 使用相对路径信息
-b, –backup 创建备份,也就是对于目的已经存在有同样的文件名时,将老的文件重新命名为filename。可以使用–suffix选项来指定不同的备份文件前缀。filename)存放在在目录下。
–backup-dir 将备份文件(如
-suffix=SUFFIX 定义备份文件前缀
-u, –update 仅仅进行更新,也就是跳过所有已经存在于DST,并且文件时间晚于要备份的文件。(不覆盖更新的文件)
-l, –links 保留软链结
-L, –copy-links 想对待常规文件一样处理软链结
–copy-unsafe-links 仅仅拷贝指向SRC路径目录树以外的链结
–safe-links 忽略指向SRC路径目录树以外的链结
-H, –hard-links 保留硬链结
-p, –perms 保持文件权限
-o, –owner 保持文件属主信息
-g, –group 保持文件属组信息
-D, –devices 保持设备文件信息
-t, –times 保持文件时间信息
-S, –sparse 对稀疏文件进行特殊处理以节省DST的空间
-n, –dry-run现实哪些文件将被传输
-W, –whole-file 拷贝文件,不进行增量检测
-x, –one-file-system 不要跨越文件系统边界
-B, –block-size=SIZE 检验算法使用的块尺寸,默认是700字节
-e, –rsh=COMMAND 指定使用rsh、ssh方式进行数据同步
–rsync-path=PATH 指定远程服务器上的rsync命令所在路径信息
-C, –cvs-exclude 使用和CVS一样的方法自动忽略文件,用来排除那些不希望传输的文件
–existing 仅仅更新那些已经存在于DST的文件,而不备份那些新创建的文件
–delete 删除那些DST中SRC没有的文件
–delete-excluded 同样删除接收端那些被该选项指定排除的文件
–delete-after 传输结束以后再删除
–ignore-errors 及时出现IO错误也进行删除
–max-delete=NUM 最多删除NUM个文件
–partial 保留那些因故没有完全传输的文件,以是加快随后的再次传输
–force 强制删除目录,即使不为空
–numeric-ids 不将数字的用户和组ID匹配为用户名和组名
–timeout=TIME IP超时时间,单位为秒
-I, –ignore-times 不跳过那些有同样的时间和长度的文件
–size-only 当决定是否要备份文件时,仅仅察看文件大小而不考虑文件时间
–modify-window=NUM 决定文件是否时间相同时使用的时间戳窗口,默认为0
-T –temp-dir=DIR 在DIR中创建临时文件
–compare-dest=DIR 同样比较DIR中的文件来决定是否需要备份
-P 等同于 –partial
–progress 显示备份过程
-z, –compress 对备份的文件在传输时进行压缩处理
–exclude=PATTERN 指定排除不需要传输的文件模式
–include=PATTERN 指定不排除而需要传输的文件模式
–exclude-from=FILE 排除FILE中指定模式的文件
–include-from=FILE 不排除FILE指定模式匹配的文件
–version 打印版本信息
–address 绑定到特定的地址
–config=FILE 指定其他的配置文件,不使用默认的rsyncd.conf文件
–port=PORT 指定其他的rsync服务端口
–blocking-io 对远程shell使用阻塞IO
-stats 给出某些文件的传输状态
–progress 在传输时现实传输过程
–log-format=formAT 指定日志文件格式
–password-file=FILE 从FILE中得到密码
–bwlimit=KBPS 限制I/O带宽,KBytes per second