MySQL 主从复制

我们之前学习的都是mysql单机的方面,包括如何优化sql,如何使用索引,如何使用查询计划查看sql的执行效率等等。但是随着系统的庞大,复杂,就要考虑到效率,容灾等等方面。这篇文章了解一下主从复制。

什么是主从复制

   是一种数据备份的方式:是使用两个或两个以上相同的数据库,将一个数据库当做主数据库,而另一个数据库当做从数据库。主数据库中进行相应操作时,从数据库记录下所有主数据库的操作,使其二者一模一样。

为什么要主从复制

1、当主数据库出现问题时,可以当从数据库代替主数据库,可以避免数据的丢失。

2、可以进行读写分离。

    我们想像一个场景:有一句sql语句需要锁表,导致暂时不能使用读的服务,那么就很影响运行中的业务,使用主从复制,让主库负责写,从库负责读,这样,即使主库出现了锁表的情景,通过读从库也可以保证业务的正常运作。

主从复制的原理

  先来认识binlog: 

  bin_log:MySQL数据库的二进制日志,用于记录用户对数据库操作的SQL语句.

  那么我们主从复制的目标就是把主数据库的bin-log文件的sql语句复制过来,然后在从库中执行一遍。

   先看一下主从复制的原理图:

MySQL 主从复制

 

  • 步骤一:主库db的更新事件(update、insert、delete)被写到binlog
  • 步骤二:从库发起连接,连接到主库
  • 步骤三:此时主库创建一个binlog dump thread,把binlog的内容发送到从库
  • 步骤四:从库启动之后,创建一个I/O线程,读取主库传过来的binlog内容并写入到relay log
  • 步骤五:还会创建一个SQL线程,从relay log里面读取内容,从Exec_Master_Log_Pos位置开始执行读取到的更新事件,将更新内容写入到slave的db

主从同步的注意点:

1.master将操作语句记录到binlog日志中,然后授予slave远程连接的权限(master一定要开启binlog二进制日志功能;通常为了数据安全考虑,slave也开启binlog功能)。

2.slave开启两个线程:IO线程和SQL线程。其中:IO线程负责读取master的binlog内容到中继日志relay log里;SQL线程负责从relay log日志里读出binlog内容,并更新到slave的数据库里,这样就能保证slave数据和master数据保持一致了。

3.Mysql复制至少需要两个Mysql的服务,当然Mysql服务可以分布在不同的服务器上,也可以在一台服务器上启动多个服务。

4.Mysql复制最好确保master和slave服务器上的Mysql版本相同(如果不能满足版本一致,那么要保证master主节点的版本低于slave从节点的版本)

5.master和slave两节点间时间需同步

主从复制存在的问题

 从主从复制的执行顺序可以看出主库与从库之间存在延迟是会出现延迟的.

 延迟的原因有:

1.主从复制,是通过网络进行数据传输,网络的抖动、主从服务器间的网络中断肯定会影响数据的传输,同样会造成数据的不一致

2.读写数据不可能是均匀,在某个时间点出现大量并发连接,主服务器不断的有更新操作不断的写入,但是从服务器当某个语句在从服务器上执行的时间较长,或者某个语句要进行锁表,就会导致主服务器的SQL语句大量积压,未被同步到从服务器,这样就会导致在某个时刻主从数据不一致

由于服务器实际运行过程中,客户端的连接服务器,读写数据不可能是均匀,在某个时间点出现大量并发连接,主服务器不断的有更新操作不断的写入,但是从服务器当某个语句在从服务器上执行的时间较长,或者某个语句要进行锁表,就会导致主服务器的SQL语句大量积压,未被同步到从服务器,这样就会导致在某个时刻主从数据不一致;还有主从复制,是通过网络进行数据传输,网络的抖动、主从服务器间的网络中断肯定会影响数据的传输,同样会造成数据的不一致。这就是主从延迟,虽说随着时间的推移,或者主服务器不在大量更新操作,主从服务器会逐步一致(网络中断除外),对于某些企业写数据时一般不做同步的查询,数据延迟就不是问题,但是一些交易型的企业(或者要求数据要求实时一致),数据的延迟是不能被接受的。

解决方案:
1、最简单的减少slave同步延时的方案就是在架构上做优化,尽量让主库的DDL快速执行。还有就是主库是写,对数据安全性较高,比如 sync_binlog=1,innodb_flush_log_at_trx_commit = 1 之类的设置,而slave则不需要这么高的数据安全,完全可以讲sync_binlog设置为0或者关闭binlog,innodb_flushlog也 可以设置为0来提高sql的执行效率。另外就是使用比主库更好的硬件设备作为slave。
2、提升主从服务器硬件性能
3、使用MySQL5.6.3以后的版本,因为mysql-5.6.3已经支持了多线程的主从复制。
虽说这些方案能一定程度上解决数据延迟,但是受MySQL主从复制的原理限制,还是会存在数据延迟的可能性的。我认为比较可行的方案还是使用MySQL Galera Cluster集群。
Mysql Galera Cluster是一套基于同步复制的多主MySQL集群解决方案,使用简单,没有单点故障,可用性高,能很好保证业务不断增长时我们数据的安全和随时的扩展。