1、Codis简介
Codis是一套用go语言编写的,为了应对高并环境下的redis集群软件,原理是对一个redis key操作前,先把这个key通过crc32算法,分配到不同redis的某一个slot上,实现并发读写功能.而且能通过zookeeper调用redis-sentinel来实现故障切换功能.现在最新版本是3.2.1,依托于redis3.2.9开发出来.
优点:实现高并发读写,数据一致性高.
缺点:性能有较大损耗,故障切换无法保证不丢key,无法进行读写分离.
2、部署Codis集群
2.1 架构介绍
2.1.1 需要用到的软件有
codis3.2.1:codis集群套件,里面含有redis相关程序,和集群专用程序,主要功能程序解析:
codis-server:属于redis-server优化版,基于 redis-3.2.9 分支开发。增加了额外的数据结构,以支持 slot 有关的操作以及数据迁移指令。
codis-proxy:客户端连接的 Redis 代理服务, 实现了 Redis 协议。 除部分命令不支持以外(例如:keys *,flush ),表现的和原生的 Redis 没有区别(就像 Twemproxy)。
redis-sentinel:可以实现对Redis的监控、通知、自动故障转移。如果Master不能工作,则会自动启动故障转移进程,将其中的一个Slave提升为Master,其他的Slave重新设置新的Master服务。Sentinel的配置由 codis-dashboard和zookeeper一起控制,不需要手工填写.
codis-dashboard:集群管理工具,支持 codis-proxy、codis-server 的添加、删除,以及据迁移等操作。在集群状态发生改变时,codis-dashboard 维护集群下所有 codis-proxy 的状态的一致性。
codis-fe:集群web管理界面。
go1.9.1:codis依赖语言包
jdk1.8:zookeeper依赖语言包
zookeeper-3.4.11:用于存放数据配置路由表。zookeeper简称zk。在生产环境中,zk部署越多,其可靠性越高。由于zk集群是以宕机个数过半才会让整个集群宕机,因此,奇数个zk更佳。
2.2.2 逻辑架构如下:
访问层:访问方式可以是vip或者是通过java代码调用jodis,然后连接调用不同的codis-proxy地址来实现高可用的LVS和HA功能.
代理层:然后中间层由codis-proxy和zookeeper处理数据走向和分配,通过crc32算法,把key平均分配在不同redis的某一个slot中.实现类似raid0的条带化,在旧版本的codis中,slot需要手工分配,在codis3.2之后,slot会自动分配,相当方便.
数据层:最后codis-proxy把数据存进真实的redis-server主服务器上,由于codis的作者黄东旭相当注重数据一致性,不允许有数据延时造成的数据不一致,所以架构从一开始就没考虑主从读写分离.从服务器仅仅是作为故障切换的冗余架构,由zookeeper调用redis-sentinel实现故障切换功能.
2.2.3 因为机器有限,部署的架构如下:
zookeeper集群:
10.0.2.5:2181
10.0.2.6:2181
10.0.2.7:2181
codis-config和codis-dashboard:
10.0.2.6:18087
10.0.2.6:8090
codis-proxy:
10.0.2.5:19000
10.0.2.7:19000
codis-server:
10.0.2.5:6379(主),10.0.2.5:6380(从)
10.0.2.6:6379(主),10.0.2.6:6380(从)
10.0.2.7:6379(主),10.0.2.7:6380(从)
2.2 安装部署
2.2.1 下载程序代码
下载golang语言程序包
按正常途径是要×××的,不过国内地址也有人放出来了,因为codis3.2要求至少是1.7或1.8以上版本的,那干脆下最新版吧.
https://studygolang.com/dl/golang/go1.9.1.linux-amd64.tar.gz
下载java语言程序包
Java的下载地址一直在变,所以最好自己上去看着来下载
下载zookeeper程序
直接就是程序包,不用编译了,好方便
http://mirrors.hust.edu.cn/apache/zookeeper/zookeeper-3.4.11/zookeeper-3.4.11.tar.gz
下载codis3.2.1
直接就是程序包,不用编译了,好方便
https://github.com/CodisLabs/codis/releases/download/3.2.1/codis3.2.1-go1.7.6-linux.tar.gz
2.2.2 安装程序
安装java
1 | #解压程序包 |
安装golang
1 | #解压程序包 |
安装zookeeper
1 | #解压程序包 |
安装完成,等候配置
安装codis
1 | #解压程序包 |
安装完成,等候配置,因为我们用的都是二进制程序包,只要依赖包有正常安装,就不会报错,直接就能用,所以安装就很简单
2.3 配置程序
2.3.1 配置zookeeper,3台一起都是这么配置
1 | #设置hosts跳转规则,好像不这么设置的话,不能顺利启动 |
生成ID,这里需要注意, myid对应的zoo.cfg的server.ID.比如zookeeper-node2对应的myid应该是2,不按规定设置,zookeeper集群将无法启动.
1 | echo "1"> /data/zookeeper/myid |
例如:在zookeeper-node3那台10.0.2.7的服务器,就应该是
1 | echo "3"> /data/zookeeper/myid |
zoo.cfg最后三行特别说明
说明:server.A=B:C:D:其中 A 是一个数字,表示这个是第几号服务器;B 是这个服务器的 ip 地址;C 表示的是这个服务器与集群中的 Leader 服务器交换信息的端口;D 表示的是万一集群中的 Leader 服务器挂了,需要一个端口来重新进行选举,选出一个新的 Leader,而这个端口就是用来执行选举时服务器相互通信的端口。
1 | #最后启动,因为zookeeper的server是有顺序的,最好是按顺序启动,先启动server.1再启动server2,最后启动server.3这样 |
配置并启动完毕
2.3.2 配置codis-server,3台一起都是这么配置
注意:codis-server就是redis-server程序,属于codis优化版本,配合codis集群使用.
所以就是配置个redis的主从结构,实际生产环境不要搭在一起
1 | #创建redis数据目录,配置文件目录,日志目录 |
除了端口号不同带来的文件名不同.实际上从库配置只是多了最后一行,指定了主库地址
1 | #然后就可以启动了,我一开始就说过codis-server就是redis-server |
启动方式和redis-server一样,指定配置文件就可以启动.这就配置并启动成功了.
2.3.3 配置redis-sentinel,3台一起都是这么配置
正确来说,redis-sentinel是要配置主从架构才能生效,但是在codis集群中并不一样,因为他的配置由zookeeper来维护,所以,这里codis使用的redis-sentinel只需要配置一些基本配置就可以了.
1 | #我们把配置放到redis数据目录的配置文件目录 |
配置并启动成功.
注意:没有配置好codis-dashboard会没最后那几行,因为还不受zookeeper控制,所以是正常的,配置好之后才会自动加载进来。
2.3.4 配置codis-proxy,这次只有两台要配置,当然你也可以配三台
这个是codis集群的核心,实际上他也没配主从架构,配置也是从zookeeper拿来用的,所以,直接来看配置吧
1 | #配置很多,我们先生成一下默认的配置文件 |
–ncpu 指定使用多少个cpu,我的是虚拟机,所以就1了,如果你是多核,那就填多个
–config 指定配置文件,就是刚才的配置文件
–log 指定输出日志文件
配置并启动成功,但是暂时还用不了,因为还需要配置codis-dashboard才能最终完成.
2.3.5 配置codis-dashboard,只需要配置一台机上
这个属于管理配置codis集群信息的工具,配置完之后的配置信息会自动加载到zookeeper集群,即使这个服务挂了,配置都还在zookeeper上,所以不用考虑高可用,单点就足够了,大不了重新启动一下也不是特别麻烦,配置界面由codis-fe来实现,所以通常也是一套配置.
1 | #我们也可以用程序来生成一下默认配置文件 |
–ncpu 指定使用多少个cpu
–config 指定配置文件
–log 指定输出日志文件
–log-level 指定日志等级,有INFO,WARN,DEBUG,ERROR
安装完成,就差最后一步就可以开始配置.
由于codis-dashboard本身是不需要密码登录的,所以这将会非常危险,强烈建议使用内网地址,而作者表示将会在下个版本考虑增加codis-dashboard的认证密码。
2.3.6 配置codis-fe,只需要配置一台机上
这个是属于web界面操作codis-dashboard配置的工具,web代码文件在codis安装文件夹的目录下,具体是:/usr/local/codis/assets/这个目录.
这个工具本身不需要配置文件就能启动,只需要指定codis-dashboard的ip和端口就可以了,但是我为了方便管理,还是生成一个配置文件的好.
1 | #生成一下配置文件,其实也就是codis-dashboard的ip和端口 |
–ncpu 指定使用多少个cpu
–log 指定输出日志文件
–log-level 指定日志等级,有INFO,WARN,DEBUG,ERROR
–dashboard-list 指定dashboard的地址和项目名称,这里因为生成了文件,所以就指定成文件了
–listen 指定codis-fe的web登录端口,也就是我们通过8090来访问这个管理端了,0.0.0.0即对来访IP无限制,其实最好是限制内网
验证一下
全套安装完成,成功启动.开始下一步.
2.4 使用举例
因为有了web界面,基本上就都是界面操作了,非常方便,配置会直接加载到zookeeper里面去.
首先,我们先添加codis-proxy地址和端口
按顺序
第一步,先添加codis-proxy的地址和管理端口,上面设置的是11080.
第二步,点击左方的橙色按钮,然后就添加完毕.
第三步,看到下方出现该有的codis-proxy地址就算完成了,然后看到右方的SYNC字样的颜色是绿色,则代表配置正常.
如果要删除记录,点击最右方的红色按钮即可.
然后,我们添加真实redis-server(也是codis-server)地址和端口
按顺序:
第一步,先创建一个组,准备把相关的一组主从放进去
第二步,点击按钮生成这个分组
第三步,添加真实redis-server地址,并选定一个分组,例如刚才创建的分组1
第四步,点击按钮生成配置
第五步,可以看到配置已经登记好,注意sync状态.
第六步,点击重新平衡所有slots数据块(任何添加和删除新旧节点都需要点击这个)
在旧版本中slots需要手动配置,但是3.2版本之后就改成自动分配了,所以已经不需要配置,点击一下就可以了.当然你也可以手动去分配.
最后配置sentinel的地址和端口
按顺序:
第一步,添加真实的sentinel地址和端口
第二步,点击按钮添加
第三步,查看状态,这里有点不一样,他会自动添加当前主从组架构由多少台,控制切换
也正如我之前说的,他们自动去改配置文件,可以去看看sentinel的配置文件证实一下,这里不展开来说了
都配置好了,就可以使用了,连接其中一个codis-proxy测一下,注意区分好登录的地址和端口,还有密码
1 | /usr/local/codis/redis-cli -h 10.0.2.5 -p 19000 -a 123456 |
可以使用了.
2.5 压力测试
2.5.1 性能测试
先用自带的redis-benchmark来压测性能,模拟500个并发和100万个请求.注意区分好登录的地址和端口,还有密码
先压测codis-proxy的性能
1 | /usr/local/codis/redis-benchmark -h 10.0.2.5 -p 19000 -a 123456 -c 500 -n 1000000 -q |
再压测单节点的性能
1 | /usr/local/codis/redis-benchmark -h 10.0.2.5 -p 6379 -a 123 -c 500 -n 1000000 -q |
redis-benchmark参数解析:
-h ip地址
-p redis端口
-a 认证密码
-c 设定多少个并发连接
-n 总共多少个请求
-q 显示模式:简要模式
然后看图
可以看到,有些操作相差不大,有些相差甚远,性能损耗明显,不过作为集群应用,主要应对的是高并发环境,性能损耗是可以接受的,何况对于redis这种内存型高速应用来说,性能损耗基本没什么太大感知.
2.5.2 数据分布测试
然后是读写分布测试:
我写了个脚本来测试:
1 | cat t-redis.sh |
脚本很简单,就是不断向codis集群写垃圾数据而已,执行脚本.
1 | bash t-redis.sh |
然后结果可以看web界面,因为你连接codis-proxy用info来看,其实是不准确的,那个显示的只是单台的数据.
可以看到,每一个组都分布得比较均匀,把压力都分到三台redis-server主服务器去了.
2.5.3 故障切换测试
然后来看故障切换,继续执行那个脚本
1 | bash t-redis.sh |
进入其中一台codis-server,例如10.0.2.5,此时状态是正常的.
开始模拟操作
1 | #查找主库进程 |
此时从库接管了主库的进程,sentinels有提示信息.
可能有人发现组1的sync按钮变成了红色,也就是说主从失效,点一下就变回正常.
现在等待数据写完,我先把旧的主进程6379端口从新起来
1 | /usr/local/codis/codis-server /data/redis/data/config/redis_6379.conf |
然后看看:
看状态是恢复正常了,但是有计算机的同学可以算一下,我的脚本执行的总共是30万个key,但是现在少了几千个.
遇到的坑
上面丢key的问题是由于redis-sentinel故障切换期间,整个codis集群并不会关闭对此故障redis-server的连接,所以codis-proxy依然会发送数据给当前故障的redis-server,而显然此时的redis-server是无法存储数据的,这就造成了丢key现象了.如果整个主从挂了,就会丢掉所有发送到此redis-server的key了,除非手工剔除故障节点.
虽然codis还自带有一种故障切换程序codis-ha,他属于一个守护进程,会连接codis-dashboard查看各节点状态,
1 | #执行一下命令启动codis-ha,端口是codis-dashboard的端口 |
–dashboard 指定dashboard的地址和端口
–log 指定日志文件
–log-level 指定日志等级,有INFO,WARN,DEBUG,ERROR
但是这个软件也是有缺陷,他会自动连接上dashboard检测各主从结构的健康信息,检测间隔很快(默认3秒,可修改参数–interval),检测到故障后,会将故障主库或者从库强制下线并删除在dashboard登记的信息.
虽然切换速度非常快,只会有很少的丢key现象(3秒还是会丢一些),但是后面会把故障旧主库强制下线,需要手动修改配置并重新启动redis-server(codis-server),还要再在codis-fe界面添加配置才行.
显然这是做不到全自动管理,有点麻烦了,而且也会让redis-sentinel变得没有意义了,所以只能两个方式选其一。
虽然看上去丢key现象是少了,但是依然还是有丢key的情况,只能说是50步笑100步,而且该组内其他 slave 实例是不会自动改变状态的,这些 slave 仍将试图从旧的 master 上同步数据,因而会导致组内新的 master 和其他 slave 之间的数据不一致。因此当出现主从切换时,需要管理员手动创建新的 sync action 来完成新 master 与 slave 之间的数据同步,这样反而增加了手动操作的工作量,各位对于codis-ha和redis-sentinel的集群的选择还是需要多考虑一些实际情况.
所以,说到底就是codis的故障切换没有做好,如果对丢key可以容忍的,就开redis-sentinel就足够了,对于数据一致性要求高的,就开codis-ha加脚本来实现比较好,各取所需.
2.6 实时添加删除节点
codis的另一个卖点就是可以在线添加/删除redis-server(codis-server)节点,做到实时扩容和更换问题节点,对于单点redis而言优势明显,不用重启服务就能有更大的空间,也可以在线切换掉有问题的节点.不过要注意,可以实时扩容和故障切换,并不代表没有性能损耗,真的要做也是要注意线上压力,避免性能压力导致的服务不可用.
实现的原理是因为codis集群把各个redis-server节点都用规则分成了多个slots数据块(总共1024个).需要扩容只要把新的节点添加完成后,在把这些slots信息从新分配就可以达到扩容效果,需要故障切换则把问题redis-server节点的slots迁移走,然后就可以把这个节点下架了,对于线上环境可以说是几乎没感知,试验过程中也没发现有丢key现象,就是性能有所下降,但是我测试的环境下性能下降还能接受,大概只有10%-30%的性能损耗.
开始试验,首先我们假设添加两个新的redis-server节点,都直接是主库,没有从库环境(因为这次不需要测故障切换):
10.0.2.5:16379
10.0.2.6:16379
2.6.1 添加一个节点
添加一个节点,等于是扩容,这还是比较简单
第一步,和之前差不多,先创建一个新组,点击按钮确认添加
第二步,把新地址添加到新的组,点击按钮确认添加
第三步,确认新的地址已成功添加进去
第四步,点击按钮,从新分配所有slots数据块
这里唯一问题就是最后一步,重新分配会耗费一定资源,codis会自动平衡数据块的分布,所以会有数据迁移过程,但是据我测试的结果来看,并不很严重,大概在20%左右.
根据它自带的监控来看的话,
可以看到之前正常情况的qps接近1500,刚点重新平衡下降比较严重一些,后面就大概有20%的性能损耗那样子,最后迁移完毕就恢复正常了.当然这是数据量少的情况,如果数据量多,这个迁移时间就恐怕不是那么简单了.
2.6.2 切换一个节点,并下架
正常下架只需要点击这个按钮
但是因为里面还有数据,是不允许直接下架的
所以我们要先迁移数据,如下所示:
第一步,确认一个需要迁移的组的数据块的编号,例如这里499-512的块是数据组4的,我现在要迁移组4,就选定这个
第二步,把刚才获取到的信息填进去,就是把500这个编号的数据块从组4迁移到组5,点击按钮执行
然后你就会看到,
显然组4的信息消失了,codis把组4的数据块都迁移到了组5去了,
这个时候,这个redis-server节点就可以删除了
至于还需不需要重新填补,这个问题则需要自身考虑.如果不需要填补,最好再点一下重新平衡slots比较好.
可以看到,又重新平衡了.
2.7 故障处理
2.7.1 codis-dashboard无法启动,并提示:
[ERROR] store: acquire lock of codis-test1 failed
[error]: zk: node already exists
由于是测试环境,我经常强制关机,导致codis-dashboard没有正常关闭.直接造成zookeeper里面的状态没有更新,最终新启动的codis-dashboard不能注册进zookeeper,一直提示已存在而被强制关闭.
修复方法也不难,就是删除这个lock的状态键值就可以了
1 | #输入项目名和zookeeper地址 |
然后,codis-dashboard又可以正常启动了.
codis-admin是可以全权控制codis集群的工具,所有添加/删除/修改的工作都可以用他来实现,参数很多,这里只是举例了一个方法,详细可以参照codis-admin –help
2.7.2 codis-proxy异常退出导致无法删除
通常codis-proxy都是通过codis-dashboard进行移除,移除过程中codis-dashboard为了安全会向codis-proxy发送offline指令,成功后才会将proxy信息从外部存储(zookeeper)中移除。如果codis-proxy异常退出,该操作会失败。此时需要手动删除zookeeper信息。
1 | #先登入zookeeper进行操作 |
然后,删不掉的proxy端就不见了,完成.
备注:
codis不支持命令列表:
Command Type | Command Name |
---|---|
Keys | KEYS |
MIGRATE | |
MOVE | |
OBJECT | |
RANDOMKEY | |
RENAME | |
RENAMENX | |
SCAN | |
Strings | BITOP |
MSETNX | |
Lists | BLPOP |
BRPOP | |
BRPOPLPUSH | |
Pub/Sub | PSUBSCRIBE |
PUBLISH | |
PUNSUBSCRIBE | |
SUBSCRIBE | |
UNSUBSCRIBE | |
Transactions | DISCARD |
EXEC | |
MULTI | |
UNWATCH | |
WATCH | |
Scripting | SCRIPT |
Server | BGREWRITEAOF |
BGSAVE | |
CLIENT | |
CONFIG | |
DBSIZE | |
DEBUG | |
FLUSHALL | |
FLUSHDB | |
LASTSAVE | |
MONITOR | |
RESTORE | |
SAVE | |
SHUTDOWN | |
SLAVEOF | |
SLOWLOG | |
SYNC | |
TIME | |
Codis Slot | SLOTSCHECK |
SLOTSDEL | |
SLOTSINFO | |
SLOTSMGRTONE | |
SLOTSMGRTSLOT | |
SLOTSMGRTTAGONE | |
SLOTSMGRTTAGSLOT |
以下属于半支持命令, Codis不支持跨节点操作,因此您必须使用散列标签将可能显示在一个请求中的所有密钥放入同一个插槽中,然后您可以使用这些命令。 Codis不检查密钥是否有相同的标签,所以如果你不使用标签,你的程序会得到错误的回应。
Command Type | Command Name |
---|---|
Lists | RPOPLPUSH |
Sets | SDIFF |
SINTER | |
SINTERSTORE | |
SMOVE | |
SUNION | |
SUNIONSTORE | |
Sorted Sets | ZINTERSTORE |
ZUNIONSTORE | |
HyperLogLog | PFMERGE |
Scripting | EVAL |
EVALSHA |