rsync+sersync实时同步

前言:

1、为什么要用Rsync+sersync架构?

sersync是基于Inotify开发的,类似于Inotify-tools的工具
sersync可以记录下被监听目录中发生变化的(包括增加、删除、修改)具体某一个文件或某一个目录的名字,然后使用rsync同步的时候,只同步发生变化的这个文件或者这个目录。

2、Rsync+Inotify-tools与Rsync+sersync这两种架构有什么区别?

Rsync+Inotify-tools

(1)Inotify-tools只能记录下被监听的目录发生了变化(包括增加、删除、修改),并没有把具体是哪个文件或者哪个目录发生了变化记录下来;
(2)rsync在同步的时候,并不知道具体是哪个文件或者哪个目录发生了变化,每次都是对整个目录进行同步,当数据量很大时,整个目录同步非常耗时(rsync要对整个目录遍历查找对比文件),因此,效率很低。

Rsync+sersync

(1)sersync可以记录下被监听目录中发生变化的(包括增加、删除、修改)具体某一个文件或某一个目录的名字;
(2)rsync在同步的时候,只同步发生变化的这个文件或者这个目录(每次发生变化的数据相对整个同步目录数据来说是很小的,rsync在遍历查找比对文件时,速度很快),因此,效率很高。
小结:当同步的目录数据量不大时,建议使用Rsync+Inotify-tools;当数据量很大(几百G甚至1T以上)、文件很多时,建议使用Rsync+sersync。

部署说明:

操作系统:CentOS 7.4
源服务器:192.168.74.137 (Sersync+web)(Master 作为主发布服务器)
目标服务器: 192.168.74.138、192.168.74.139(Rsync+web)(此处可逐步增加集群的slave)

目的:

把源服务器上/work/admin/data 目录实时同步到目标服务器的/work/admin/data 下

具体操作:

3、安装Rsync服务端

分别在两台目标服务器192.168.74.138/139上操作

3.1 关闭SELINUX
1
2
3
4
5
[admin@haifly-bj-static1 ~]$ sudo vim /etc/selinux/config
#SELINUX=enforcing
#SELINUXTYPE=targeted
SELINUX=disabled
[admin@haifly-bj-static1 ~]$ sudo setenforce 0 #立即生效
3.2 开启防火墙tcp 873端口(Rsync默认端口)
1
2
3
4
5
6
[admin@haifly-bj-static1 ~]$ sudo vim /etc/sysconfig/iptables #编辑防火墙配置文件
-A RH-Firewall-1-INPUT -m state --state NEW -m tcp -ptcp --dport 873 -j ACCEPT
:wq! #保存退出

#最后重启防火墙使配置生效
[admin@haifly-bj-static1 ~]$ sudo systemctl restart firewalld.service
3.3 安装Rsync服务端软件
1
2
3
4
5
[admin@haifly-bj-static1 ~]$ wget https://download.samba.org/pub/rsync/rsync-3.1.3.tar.gz
[admin@haifly-bj-static1 ~]$ tar -zxf rsync-3.1.3.tar.gz
[admin@haifly-bj-static1 rsync-3.1.3] cd rsync-3.1.3
[admin@haifly-bj-static1 rsync-3.1.3] ./configure --prefix=/work/admin/rsync
[admin@haifly-bj-static1 rsync-3.1.3] make && make install
3.4 修改rsyncd.conf配置文件
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
[admin@haifly-bj-static1 ~]$ mkdir /work/admin/rsync/conf
[admin@haifly-bj-static1 ~]$ vim /work/admin/rsync/conf/rsyncd.conf
uid = admin
gid = admin
use chroot = no
list = no
log file = /work/admin/rsync/rsyncd.log
pid file = /work/admin/rsync/rsyncd.pid
lock file = /work/admin/rsync/rsync.lock
exclude = lost+found/
transfer logging = yes
timeout = 200
ignore nonreadable = yes
dont compress = *.gz *.tgz *.zip *.z *.Z *.rpm *.deb *.bz2

[static]
path=/work/admin/data/
comment=static
ignore errors
port=873
read only=no
use chroot= no
list=yes
max connections=200
timeout=600
auth users=admin
strict modes=no
secrets file=/work/admin/rsync/conf/rsync.passwd
hosts allow= 192.168.74.137
hosts deny = *

log file =/work/admin/rsync/rsyncd.log #日志文件位置,启动rsync后自动产生这个文件,无需提前创建
pidfile =/work/admin/rsync/rsyncd.pid #pid文件的存放位置
lock file =/work/admin/rsync/rsync.lock #支持max connections参数的锁文件
secretsfile =/work/admin/rsync/rsync.passwd #用户认证配置文件,里面保存用户名称和密码,后面会创建这个文件
motd file =/etc/rsyncd.Motd #rsync启动时欢迎信息页面文件位置(文件内容自定义)
[Sync] #自定义名称
path = /work/admin/data/ #rsync服务端数据目录路径
comment = static #模块名称与[md]自定义名称相同
uid = admin #设置rsync运行权限为admin
gid = admin #设置rsync运行权限为admin
port=873 #默认端口
use chroot= no #默认为true,修改为no,增加对目录文件软连接的备份
read only =no #设置rsync服务端文件为读写权限
list = no #不显示rsync服务端资源列表
maxconnections = 200 #最大连接数
timeout =600 #设置超时时间
auth users= admin #执行数据同步的用户名,可以设置多个,用英文状态下逗号隔开
hosts allow= 192.168.74.137 #允许进行数据同步的客户端IP地址,可以设置多个,用英文状态下逗号隔开
hosts deny= * #禁止数据同步的客户端IP地址,可以设置多个,用英文状态下逗号隔开
:wq! #保存,退出(贴进配置文件将中文去掉,否则可能造成无法识别模块)

3.5 创建用户认证文件,data数据存储目录

配置文件,添加以下内容,添加允许传输用户和密码

1
2
3
[admin@haifly-bj-static1 ~]$ vim /work/admin/rsync/conf/rsync.passwd
admin:123456
[admin@haifly-bj-static1 ~]$ mkdir /work/admin/data
3.6 设置文件权限
1
[admin@haifly-bj-static1 ~]$ chmod 600  /work/admin/rsync/conf/rsync.passwd
3.7 配置rsync服务启动
1
2
3
4
5
6
7
8
9
10
11
[admin@haifly-bj-static1 ~]$ sudo vim /etc/systemd/system/rsyncd.service
[Unit]
Description=fast remote file copy program daemon
ConditionPathExists=/work/admin/rsync/conf/rsyncd.conf

[Service]
EnvironmentFile=/work/admin/rsync/bin/rsync
ExecStart=/work/admin/rsync/bin/rsync --daemon --no-detach "$OPTIONS"

[Install]
WantedBy=multi-user.target
3.8 启动rsync 服务端
1
2
3
[admin@haifly-bj-static1 ~]$ sudo ln -s /work/admin/rsync/conf/rsyncd.conf /etc/rsyncd.conf
[admin@haifly-bj-static1 ~]$ sudo systemctl enable rsyncd
[admin@haifly-bj-static1 ~]$ sudo systemctl start rsyncd

4、安装Rsync客户端

在源服务器192.168.74.137上操作

4.1 关闭SELINUX
1
2
3
4
5
6
[admin@haifly-bj-manage1 ~]$ sudo vim /etc/selinux/config
#SELINUX=enforcing #注释掉
#SELINUXTYPE=targeted #注释掉
SELINUX=disabled #增加
:wq! #保存退出
[admin@haifly-bj-manage1 ~]$ sudo setenforce 0 #立即生效
4.2 安装Rsync客户端端软件
1
2
3
4
5
[admin@haifly-bj-manage1 ~]$ wget https://download.samba.org/pub/rsync/rsync-3.1.3.tar.gz
[admin@haifly-bj-manage1 ~]$ tar -zxf rsync-3.1.3.tar.gz
[admin@haifly-bj-manage1 rsync-3.1.3] cd rsync-3.1.3
[admin@haifly-bj-manage1 rsync-3.1.3] ./configure --prefix=/work/admin/rsync
[admin@haifly-bj-manage1 rsync-3.1.3] make && make install

或者可以使用yum安装,客户端不需要启动rsync也不需要修改配置文件

4.3 创建认证密码文件
1
2
3
4
5
6
编辑文件,添加以下内容,该密码应与目标服务器中的/work/admin/rsync/conf/rsync.passwd中的密码一致
[admin@haifly-bj-manage1 ~]$ mkdir -p /work/admin/rsync/conf
[admin@haifly-bj-manage1 ~]$ vim /work/admin/rsync/conf/rsync.passwd
123456

[admin@haifly-bj-manage1 ~]$ chmod 600 /work/admin/rsync/conf/rsync.passwd
4.4 测试源服务器192.168.74.137到目标服务器 192.168.74.138/139之间的数据同步
1
2
3
4
[admin@haifly-bj-manage1 ~]$ mkdir -p /work/admin/data/ceshi  #在源服务器上创建测试文件夹,然后在源服务器运行下面1行命令
[admin@haifly-bj-manage1 ~]$ rsync -avH --port=873 --progress --delete /work/admin/data/ admin@192.168.74.138::static --password-file=/work/admin/rsync/conf/rsync.passwd

运行完成后,分别在目标服务器192.168.74.138/139上查看,在/work/admin/data/ 目录下有ceshi文件夹,说明数据同步成功,命令中目录可以随意目录,传输到目标服务器目录时文件(或目录)均放到/work/admin/rsync/rsyncd.conf配置的服务器目录路径,如果源目录改变了,那么传输时两个目录将进行目录匹配,会有增删动作,因此需要注意。

5、安装sersync工具,实时触发rsync进行同步

5.1 查看服务器内核是否支持inotify
1
2
3
4
[admin@haifly-bj-manage1 ~]$ ll /proc/sys/fs/inotify  #列出文件目录,出现下面的内容,说明服务器内核支持inotify
-rw-r--r-- 1 root root 0 Jun 27 18:21 max_queued_events
-rw-r--r-- 1 root root 0 Jun 27 18:21 max_user_instances
-rw-r--r-- 1 root root 0 Jun 27 18:21 max_user_watches

备注:Linux下支持inotify的内核最小为2.6.13,可以输入命令:#uname -a查看内核
CentOS 7.4内核为3.10.0,默认已经支持inotify

5.2 修改inotify默认参数(inotify默认内核参数值太小)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
查看系统默认参数值:
sysctl -a | grep max_queued_events
结果是:fs.inotify.max_queued_events= 16384
sysctl -a | grep max_user_watches
结果是:fs.inotify.max_user_watches= 8192
sysctl -a | grep max_user_instances
结果是:fs.inotify.max_user_instances= 128

修改参数:
[admin@haifly-bj-manage1 ~]$ sudo vim /etc/sysctl.conf #添加以下代码
fs.inotify.max_queued_events=99999999
fs.inotify.max_user_watches=99999999
fs.inotify.max_user_instances=65535

[admin@haifly-bj-manage1 ~]$ sudo sysctl -p

参数说明:
max_queued_events:
inotify队列最大长度,如果值太小,会出现”** Event QueueOverflow **”错误,导致监控文件不准确
max_user_watches:
要同步的文件包含多少目录,可以用:find /home/Sync-type d | wc -l 统计,必须保证max_user_watches值大于统计结果(这里/home/Sync为同步文件目录)
max_user_instances:
每个用户创建inotify实例最大值

5.3 安装sersync
1
2
3
4
sersync下载地址:https://storage.googleapis.com/google-code-archive-downloads/v2/code.google.com/sersync/sersync2.5.4_64bit_binary_stable_final.tar.gz

[admin@haifly-bj-manage1 downloads]$ tar -zxvf sersync2.5.4_64bit_binary_stable_final.tar.gz
[admin@haifly-bj-manage1 downloads]$ mv -f GNU-Linux-x86 /work/admin/sersync
5.4 配置sersync
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
[admin@haifly-bj-manage1 downloads]$ cd /work/admin/sersync
[admin@haifly-bj-manage1 downloads]$ cp confxml.xml confxml.xml.bak
[admin@haifly-bj-manage1 downloads]$ vim confxml.xml #编辑,修改下面的代码
<?xml version="1.0" encoding="ISO-8859-1"?>
<head version="2.5">
<host hostip="192.168.74.137" port="8008"></host>
<debug start="false"/>
<fileSystem xfs="false"/>
<filter start="false">
<exclude expression="(.*)\.svn"></exclude>
<exclude expression="(.*)\.gz"></exclude>
<exclude expression="^info/*"></exclude>
<exclude expression="^static/*"></exclude>
</filter>
<inotify>
<delete start="true"/>
<createFolder start="true"/>
<createFile start="false"/>
<closeWrite start="true"/>
<moveFrom start="true"/>
<moveTo start="true"/>
<attrib start="false"/>
<modify start="false"/>
</inotify>

<sersync>
<localpath watch="/work/admin/data/">
<remote ip="192.168.74.138" name="static"/>
<remote ip="192.168.74.139" name="static"/>
<!--<remote ip="192.168.8.39" name="tongbu"/>-->
<!--<remote ip="192.168.8.40" name="tongbu"/>-->
</localpath>
<rsync>
<commonParams params="-artuz"/>
<auth start="true" users="admin" passwordfile="/work/admin/rsync/conf/rsync.passwd"/>
<userDefinedPort start="false" port="873"/><!-- port=874 -->
<timeout start="false" time="100"/><!-- timeout=100 -->
<ssh start="false"/>
</rsync>
<failLog path="/work/admin/rsync/rsync_fail_log.sh" timeToExecute="60"/><!--default every 60mins execute once-->
<crontab start="true" schedule="600"><!--600mins-->
<crontabfilter start="false">
<exclude expression="*.php"></exclude>
<exclude expression="info/*"></exclude>
</crontabfilter>
</crontab>
<plugin start="false" name="command"/>
</sersync>

<plugin name="command">
<param prefix="/bin/sh" suffix="" ignoreError="true"/> <!--prefix /opt/tongbu/mmm.sh suffix-->
<filter start="false">
<include expression="(.*)\.php"/>
<include expression="(.*)\.sh"/>
</filter>
</plugin>

<plugin name="socket">
<localpath watch="/opt/tongbu">
<deshost ip="192.168.138.20" port="8009"/>
</localpath>
</plugin>
<plugin name="refreshCDN">
<localpath watch="/data0/htdocs/cms.xoyo.com/site/">
<cdninfo domainname="ccms.chinacache.com" port="80" username="xxxx" passwd="xxxx"/>
<sendurl base="http://pic.xoyo.com/cms"/>
<regexurl regex="false" match="cms.xoyo.com/site([/a-zA-Z0-9]*).xoyo.com/images"/>
</localpath>
</plugin>
</head>

参数说明:
localpath watch=”/work/admin/data/“:#源服务器同步目录
remote ip=”192.168.74.138”:#目标服务器IP地址
name=”static”: #目标服务器rsync同步目录模块名称
users=”admin”: #目标服务器rsync同步用户名
passwordfile=”/work/admin/rsync/rsync.passwd”: #目标服务器rsync同步用户的密码在源服务器的存放路径
failLogpath=”/work/admin/rsync/rsync_fail_log.sh” #脚本运行失败日志记录
start=“true” #设置为true,每隔600分钟执行一次全盘同步

5.5 设置sersync监控开机自动执行

编辑rc.local,在最后添加一行

1
2
3
4
[admin@haifly-bj-manage1 downloads]$ sudo vim /etc/rc.d/rc.local
su - admin -c "/work/admin/sersync/sersync2 -d -r -o /work/admin/sersync/confxml.xml"
[admin@haifly-bj-manage1 downloads]$ sudo chmod +x /etc/rc.d/rc.local
[admin@haifly-bj-manage1 downloads]$ source /etc/rc.d/rc.local
5.6 添加脚本监控sersync
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
[admin@haifly-bj-manage1 downloads]$ mkdir /work/admin/crontab/
[admin@haifly-bj-manage1 downloads]$ vim /work/admin/crontab/check_sersync.sh #
#!/bin/sh
sersync="/work/admin/sersync/sersync2"
confxml="/work/admin/sersync/confxml.xml"
status=$(ps aux |grep 'sersync2'|grep -v 'grep'|wc -l)
if [ $status -eq 0 ];
then
$sersync -d -r -o $confxml &
else
exit 0;
fi

#添加脚本执行权限
[admin@haifly-bj-manage1 downloads]$ chmod +x /work/admin/crontab/check_sersync.sh
[admin@haifly-bj-manage1 downloads]$ crontab -e
*/5 * * * * /work/admin/crontab/check_sersync.sh >/dev/null 2>&1

#确认crontab服务在运行
[admin@haifly-bj-manage1 downloads]$ systemctl status crond.service
5.6 测试sersync实时触发rsync同步脚本是否正常运行

在源服务器192.168.74.137上创建文件inotify_rsync_ceshi

1
[admin@haifly-bj-manage1 downloads]$ mkdir /work/admin/data/inotify_rsync_ceshi

重新启动源服务器:192.168.74.137
等系统启动之后,查看两台目标服务器 192.168.74.138/139的/work/admin/data/下是否有inotify_rsync_ceshi文件夹。
然后再在源服务器192.168.74.137创建文件夹inotify_rsync_ceshi_new

1
[admin@haifly-bj-manage1 downloads]$ touch /work/admin/data/inotify_rsync_ceshi_new

继续查看两台目标服务器 192.168.74.138/139的/work/admin/data下是否有inotify_rsync_ceshi_new文件。
如果以上测试都通过,说明inotify实时触发rsync同步脚本运行正常。
至此,Linux下Rsync+sersync实现数据实时同步完成。

扩展阅读:
rsync参数
-v, –verbose 详细模式输出
-q, –quiet 精简输出模式
-c, –checksum 打开校验开关,强制对文件传输进行校验
-a, –archive 归档模式,表示以递归方式传输文件,并保持所有文件属性,等于-rlptgoD
-r, –recursive 对子目录以递归模式处理
-R, –relative 使用相对路径信息
-b, –backup 创建备份,也就是对于目的已经存在有同样的文件名时,将老的文件重新命名为filename。可以使用–suffix选项来指定不同的备份文件前缀。
–backup-dir 将备份文件(如
filename)存放在在目录下。
-suffix=SUFFIX 定义备份文件前缀
-u, –update 仅仅进行更新,也就是跳过所有已经存在于DST,并且文件时间晚于要备份的文件。(不覆盖更新的文件)
-l, –links 保留软链结
-L, –copy-links 想对待常规文件一样处理软链结
–copy-unsafe-links 仅仅拷贝指向SRC路径目录树以外的链结
–safe-links 忽略指向SRC路径目录树以外的链结
-H, –hard-links 保留硬链结
-p, –perms 保持文件权限
-o, –owner 保持文件属主信息
-g, –group 保持文件属组信息
-D, –devices 保持设备文件信息
-t, –times 保持文件时间信息
-S, –sparse 对稀疏文件进行特殊处理以节省DST的空间
-n, –dry-run现实哪些文件将被传输
-W, –whole-file 拷贝文件,不进行增量检测
-x, –one-file-system 不要跨越文件系统边界
-B, –block-size=SIZE 检验算法使用的块尺寸,默认是700字节
-e, –rsh=COMMAND 指定使用rsh、ssh方式进行数据同步
–rsync-path=PATH 指定远程服务器上的rsync命令所在路径信息
-C, –cvs-exclude 使用和CVS一样的方法自动忽略文件,用来排除那些不希望传输的文件
–existing 仅仅更新那些已经存在于DST的文件,而不备份那些新创建的文件
–delete 删除那些DST中SRC没有的文件
–delete-excluded 同样删除接收端那些被该选项指定排除的文件
–delete-after 传输结束以后再删除
–ignore-errors 及时出现IO错误也进行删除
–max-delete=NUM 最多删除NUM个文件
–partial 保留那些因故没有完全传输的文件,以是加快随后的再次传输
–force 强制删除目录,即使不为空
–numeric-ids 不将数字的用户和组ID匹配为用户名和组名
–timeout=TIME IP超时时间,单位为秒
-I, –ignore-times 不跳过那些有同样的时间和长度的文件
–size-only 当决定是否要备份文件时,仅仅察看文件大小而不考虑文件时间
–modify-window=NUM 决定文件是否时间相同时使用的时间戳窗口,默认为0
-T –temp-dir=DIR 在DIR中创建临时文件
–compare-dest=DIR 同样比较DIR中的文件来决定是否需要备份
-P 等同于 –partial
–progress 显示备份过程
-z, –compress 对备份的文件在传输时进行压缩处理
–exclude=PATTERN 指定排除不需要传输的文件模式
–include=PATTERN 指定不排除而需要传输的文件模式
–exclude-from=FILE 排除FILE中指定模式的文件
–include-from=FILE 不排除FILE指定模式匹配的文件
–version 打印版本信息
–address 绑定到特定的地址
–config=FILE 指定其他的配置文件,不使用默认的rsyncd.conf文件
–port=PORT 指定其他的rsync服务端口
–blocking-io 对远程shell使用阻塞IO
-stats 给出某些文件的传输状态
–progress 在传输时现实传输过程
–log-format=formAT 指定日志文件格式
–password-file=FILE 从FILE中得到密码
–bwlimit=KBPS 限制I/O带宽,KBytes per second

-------------本文结束感谢您的阅读-------------