LVS负载均衡
LVS是 Linux Virtual Server 的简称,即Linux虚拟服务器。LB负载均衡集群是load balance的简写。常用的负载均衡开源软件有nginx、lvs、haproxy,硬件设备有F5、Netscale。
LB集群原理:当用户的请求过来时,直接分发到Director Server上,它把用户请求根据设置好的调度算法,智能均衡地分发到后端的真实服务器(real server)上。为避免不同机器上用户请求得到的数据不一样,需要用到共享存储,保证所有用户请求的数据一样。
一、基本介绍
通过 LVS 达到的负载均衡技术和 Linux 操作系统实现一个高性能高可用的 Linux 服务器集群,LVS架构从逻辑上可分为调度层、Server集群层和共享存储。
主要特点:
高并发连接:基于内核网络层面工作,有超强的承载能力和并发处理能力。单台LVS负载均衡器可支持上万并发连接。
稳定性强:工作在网络4层上仅作分发之用,这个特点决定了它在负载均衡里的性能最强,稳定性最好,对内存和cpu消耗极低。
成本低廉:硬件负载均衡器少则十几万,多则几十上百万,LVS只需一台服务器和就能免费部署使用。
配置简单:仅需几行命令即可完成配置,也可写脚本进行管理。
多种算法:可根据业务场景灵活调配进行使用。
多种工作模式:可根据业务场景,使用不同的工作模式。
应用范围广:工作在4层,所以它几乎可以对所有应用做负载均衡,包括http、数据库、DNS、ftp服务等。
缺点:
工作在4层,不支持7层规则修改,机制过于庞大,不适合小规模应用。
二、工作原理
-
当用户向负载均衡调度器(Director Server)发起请求,调度器将请求发往至内核空间
-
PREROUTING链首先会接收到用户请求,判断目标IP确定是本机IP,将数据包发往INPUT链
-
IPVS是工作在INPUT链上的,当用户请求到达INPUT时,IPVS会将用户请求和自己已定义好的集群服务进行比对,如果用户请求的就是定义的集群服务,那么此时IPVS会强行修改数据包里的目标IP地址及端口,并将新的数据包发往POSTROUTING链
-
POSTROUTING链接收数据包后发现目标IP地址刚好是自己的后端服务器,那么此时通过选路,将数据包最终发送给后端的服务器
三、八种调度算法
- 轮询调度 rr
按依次循环的方式将请求调度到不同的服务器上。轮询算法假设所有的服务器处理请求的能力都一样,调度器将所有请求平均分配给每个真实服务器,不管后端 RS 配置和处理能力,非常均衡地分发下去。
- 加权轮询 wrr
比 rr 的算法多了权重的概念,可以给 RS 设置权重,权重越高,分发的请求数越多,权重的取值范围 0~100。如果服务器A的权值为1,服务器B的权值为2,则调度到服务器B的请求是服务器A的2倍。权值越高的服务器,处理的请求越多。
- 最少链接 lc
根据后端 RS 连接数来决定把请求分发给谁,比如 RS1 连接数比 RS2 连接数少,请求就优先发给 RS1。
- 加权最少链接 wlc
比 lc 多了一个权重的概念。
- 基于局部性的最少连接调度算法 lblc
请求数据包的目标 IP 地址,先根据请求的目标 IP 寻找最近的该目标 IP 所有使用的服务器,如果这台服务器依然可用,并且有能力处理该请求,调度器会尽量选择相同的服务器,否则会继续选择其它可行服务器。
- 复杂的基于局部性最少的连接算法 lblcr
记录的不是要给目标 IP 与一台服务器之间的连接记录,它会维护一个目标 IP 到一组服务器之间的映射关系,防止单点服务器负载过高。
- 目标地址散列调度算法 dh
根据目标 IP 地址通过散列函数将目标 IP 与服务器建立映射关系,出现服务器不可用或负载过高的情况下,发往该目标 IP 的请求会固定发给该服务器。
- 源地址散列调度算法 sh
与目标地址散列调度算法类似,但它是根据源地址散列算法进行静态分配固定的服务器资源。
四、LVS结合keepalive
LVS可以实现负载均衡,但不能进行健康检查,比如一个rs出现故障,LVS仍然会把请求转发给故障的rs,这样就导致请求无效。keepalive 可以进行健康检查,且能同时实现LVS的高可用性,解决LVS单点故障的问题。