18.1 集群介绍
- 根据功能划分为两大类:高可用和负载均衡
- 高可用集群通常为两台服务器,一台工作,另外一台作为冗余,当提供服务的机器宕机,冗余将接替继续提供服务
- 实现高可用的开源软件有:heartbeat、keepalived
- 负载均衡集群,需要有一台服务器作为分发器,它负责把用户的请求分发给后端的服务器处理,在这个集群里,除了分发器外,就是给用户提供服务的服务器了,这些服务器数量至少为2
- 实现负载均衡的开源软件有LVS、keepalived、haproxy、nginx,商业的有F5、Netscaler
18.2 keepalived介绍
- keepalived通过虚拟路由冗余协议,即VRRP(Virtual Router Redundancy Protocol)实现高可用。
- 在VRRP协议里会将多台功能相同的路由器组成一个小组,小组里会有1个master角色和N(N>=1)个backup角色
- master会通过组播的形式向各个backup发送VRRP协议的数据包,当backup收不到master发来的VRRP数据包时,就会认为master宕机了,此时就需要根据各个backup的优先级来决定谁成为新的master
- Keepalived要有三个模块,分别是core、check和vrrp。其中core模块为keepalived的核心,负责主进程的启动、维护以及全局配置文件的加载和解析,check模块负责健康检查,vrrp模块是来实现VRRP协议的
18.3~18.5 用keepalived配置高可用集群
1、高可用集群配置准备
- 准备两台机器A和B,A作为master,B作为backup
- 两台机器都执行命令:yum install -y keepalived,安装keepalived
- 两台机器都安装nginx,其中A上已经编译安装过nginx,B上需要通过yum的方式安装nginx: yum install -y nginx
- 设定vip为100
2、A机器(master)配置
- 编辑A机器上的keepalived配置文件,内容从https://coding.net/u/aminglinux/p/aminglinux-
• book/git/blob/master/D21Z/master_keepalived.conf获取
global_defs {
notification_email {
test
@test
.com
}
notification_email_from root
@testlinux
.com
smtp_server
127.0.0.1
smtp_connect_timeout
30
router_id LVS_DEVEL
}
vrrp_script chk_nginx { #检测服务是否正常
script
"/usr/local/sbin/check_ng.sh"
interval
3
}
vrrp_instance VI_1 {
state MASTER #主从角色不一致
interface
ens33
virtual_router_id
51 #主备的id一致
priority
100 #权重,主备角色权重不同
advert_int
1
authentication
{
auth_type PASS
auth_pass testlinux>com
}
virtual_ipaddress { #VIP,主备公有的IP,配置一致,主一旦宕机,从则绑定该IP
192.168.188.100
}
track_script {
chk_nginx
}
}
- A机器上编辑监控脚本,内容从https://coding.net/u/aminglinux/p/aminglinux-book/git/blob/master/D21Z/master_check_ng.sh获取,给脚本赋予755权限
#!/bin/bash
#时间变量,用于记录日志
d=`date --date today +%Y%m%d_%H:%M:%S`
#计算nginx进程数量
n=`ps -C nginx --no-heading|wc -l`
#如果进程为0,则启动nginx,并且再次检测nginx进程数量,
#如果还为0,说明nginx无法启动,此时需要关闭keepalived
if [ $n -eq "0" ]; then
/etc/init.d/nginx start #从机器上的nginx通过yum安装的,则启动命令:systemctl start nginx
n2=`ps -C nginx --no-heading|wc -l`
if [ $n2 -eq "0" ]; then
echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log
systemctl stop keepalived
fi
fi
- A机器上启动keeplived服务:systemctl start keepalived
3、B机器(backup)配置
- B机器上编辑keepalived配置文件,清空文件内容命令:> /etc/keepalived/keepalived.conf;编辑的内容从https://coding.net/u/aminglinux/p/aminglinux-book/git/blob/master/D21Z/backup_keepalived.conf获取
- B机器上编辑监控脚本,内容从https://coding.net/u/aminglinux/p/aminglinux-book/git/blob/master/D21Z/backup_check_ng.sh获取,给脚本755权限
- B机器上也启动keeplived服务 systemctl start keepalived
4、测试高可用
- 先确定好两台机器上nginx差异,比如可以通过curl -I 来查看nginx版本
- 测试1:关闭master上的nginx服务, 预期结果:主从关闭后nginx会自动重启,因为check_ng.sh脚本的作用
- 测试2:在master上增加iptabls规则,将从主上出去的vrrp协议包扔掉,预期结果:未能切换资源
iptables -I OUTPUT -p vrrp -j DROP
- 测试3:关闭master上的keepalived服务, 预期结果:主释放VIP,从绑定VIP,访问VIP,内容有变
- 测试4:启动master上的keepalived服务, 预期结果:主立即绑定VIP,访问VIP,内容恢复为主