LVS负载均衡

LVS是 Linux Virtual Server 的简称,即Linux虚拟服务器。LB负载均衡集群是load balance的简写。常用的负载均衡开源软件有nginx、lvs、haproxy,硬件设备有F5、Netscale。

LB集群原理:当用户的请求过来时,直接分发到Director Server上,它把用户请求根据设置好的调度算法,智能均衡地分发到后端的真实服务器(real server)上。为避免不同机器上用户请求得到的数据不一样,需要用到共享存储,保证所有用户请求的数据一样。

一、基本介绍

通过 LVS 达到的负载均衡技术和 Linux 操作系统实现一个高性能高可用的 Linux 服务器集群,LVS架构从逻辑上可分为调度层、Server集群层和共享存储。

主要特点:

高并发连接:基于内核网络层面工作,有超强的承载能力和并发处理能力。单台LVS负载均衡器可支持上万并发连接。

稳定性强:工作在网络4层上仅作分发之用,这个特点决定了它在负载均衡里的性能最强,稳定性最好,对内存和cpu消耗极低。

成本低廉:硬件负载均衡器少则十几万,多则几十上百万,LVS只需一台服务器和就能免费部署使用。

配置简单:仅需几行命令即可完成配置,也可写脚本进行管理。

多种算法:可根据业务场景灵活调配进行使用。

多种工作模式:可根据业务场景,使用不同的工作模式。

应用范围广:工作在4层,所以它几乎可以对所有应用做负载均衡,包括http、数据库、DNS、ftp服务等。

缺点:

工作在4层,不支持7层规则修改,机制过于庞大,不适合小规模应用。

二、工作原理

LVS负载均衡
LVS负载均衡

  1. 当用户向负载均衡调度器(Director Server)发起请求,调度器将请求发往至内核空间

  2. PREROUTING链首先会接收到用户请求,判断目标IP确定是本机IP,将数据包发往INPUT链

  3. IPVS是工作在INPUT链上的,当用户请求到达INPUT时,IPVS会将用户请求和自己已定义好的集群服务进行比对,如果用户请求的就是定义的集群服务,那么此时IPVS会强行修改数据包里的目标IP地址及端口,并将新的数据包发往POSTROUTING链

  4. POSTROUTING链接收数据包后发现目标IP地址刚好是自己的后端服务器,那么此时通过选路,将数据包最终发送给后端的服务器

三、八种调度算法

  1. 轮询调度 rr

按依次循环的方式将请求调度到不同的服务器上。轮询算法假设所有的服务器处理请求的能力都一样,调度器将所有请求平均分配给每个真实服务器,不管后端 RS 配置和处理能力,非常均衡地分发下去。

  1. 加权轮询 wrr

比 rr 的算法多了权重的概念,可以给 RS 设置权重,权重越高,分发的请求数越多,权重的取值范围 0~100。如果服务器A的权值为1,服务器B的权值为2,则调度到服务器B的请求是服务器A的2倍。权值越高的服务器,处理的请求越多。

  1. 最少链接 lc

根据后端 RS 连接数来决定把请求分发给谁,比如 RS1 连接数比 RS2 连接数少,请求就优先发给 RS1。

  1. 加权最少链接 wlc

比 lc 多了一个权重的概念。

  1. 基于局部性的最少连接调度算法 lblc

请求数据包的目标 IP 地址,先根据请求的目标 IP 寻找最近的该目标 IP 所有使用的服务器,如果这台服务器依然可用,并且有能力处理该请求,调度器会尽量选择相同的服务器,否则会继续选择其它可行服务器。

  1. 复杂的基于局部性最少的连接算法 lblcr

记录的不是要给目标 IP 与一台服务器之间的连接记录,它会维护一个目标 IP 到一组服务器之间的映射关系,防止单点服务器负载过高。

  1. 目标地址散列调度算法 dh

根据目标 IP 地址通过散列函数将目标 IP 与服务器建立映射关系,出现服务器不可用或负载过高的情况下,发往该目标 IP 的请求会固定发给该服务器。

  1. 源地址散列调度算法 sh

与目标地址散列调度算法类似,但它是根据源地址散列算法进行静态分配固定的服务器资源。

四、LVS结合keepalive

LVS可以实现负载均衡,但不能进行健康检查,比如一个rs出现故障,LVS仍然会把请求转发给故障的rs,这样就导致请求无效。keepalive 可以进行健康检查,且能同时实现LVS的高可用性,解决LVS单点故障的问题。