当前位置: 首页>数据库>正文

Mysql MVCC机制 && 主从复制三大模式

1、MVCC

  1. 简单讲讲你对 MVCC 的理解。

MVCC在MySQL InnoDB中的实现主要是为了提高数据库并发性能,用更好的方式去处理读-写冲突,做到即使有读写冲突时,也能做到不加锁,做到非阻塞并发读

  1. MVCC多版本并发控制的原理

通过undo_log多版本链条,加上开启事务时产生的readView(不同隔离级别有不同产生策略),然后再有一个查询的时候,根据readView进行判断的机制,来决定读取哪个版本的数据。实现了多事务并发执行,保证只能读开启事务前提交的数据和当前事务修改的数据,其他情况都不会读到

也就是说,不管事务执行多长时间,事务内部看到的数据是不受其它事务影响的,根据事务开始的时间不同,不同事务对同一张表,同一时刻看到的数据可能是不一样的。

MVCC实现

隐式字段

在表中,除了我们自定义的列,实际上MySQL会隐式的定义三个字段

  • DB_TRX_ID事务ID,创建这条记录/最后一次修改该记录的事务ID

  • DB_ROLL_PTR回滚指针,指向这条记录的上一个版本

  • DB_ROW_ID:隐含的自增ID(隐藏主键),如果数据表没有主键,InnoDB会自动以DB_ROW_ID`产生一个聚簇索引

undo_log 日志版本链

undo_log 版本链是指一行数据被多个事务依次修改过后,在每个事务修改完后,Mysql会保留修改前的数据undo回滚日志,并且用两个隐藏字段trx_id和roll_pointer把这些undo日志串联起来形成一个历史记录版本链

  • insert undo log:代表事务在insert新纪录时产生的undo_log,只在事务回滚时需要,并且在事务提交后可以被立即抛弃。

  • update undo log:事务在update或者delete时产生的undo log,不仅在事务回滚时需要,在快照读时也需要;所以不能随便删除,只要在快速读或者事务回滚不涉及该日志时,对应的日志才会被purge线程统一清除。

Mysql MVCC机制 && 主从复制三大模式,第1张

Read View

Read View是事务进行快照读操作时产生的读视图(RV),在该事务执行快照读的那一刻,会生成数据库系统的当前的一个快照,记录并维护当前活跃事务的ID(当每个事务开启时,都会被分配一个ID,这个ID是自增的,所以最新的事务,ID值越大)

RV主要是用来做可见行判断的,即当我们某个事务执行快照读的时候,对该记录创建一个RV读视图,把它比作条件来判断当前事务能够看到哪个版本的数据,既可能是当前最新的数据,也有可能是该行记录的undo log里面的某个版本的数据。

RV遵循一个可见性算法,主要是将要被修改的数据的最新记录的DB_TRX_ID(即当前事务ID),与系统当前其他活跃事务的ID去对比(由RV维护),如果DB_TRX_ID跟RV的属性做了某些对比,不符合可见性,那么就由DB_ROLL_PTR回滚指针去取出undo log中的DB_TRX_ID再比较,即遍历链表的DB_TRX_ID(从链表头到尾,即从最近的一次修改查起),直到找到满足特定条件的DB_TRX_ID,那么这个DB_TRX_ID所在的旧记录就是当前事务能看见的最新老版本

实现流程

Mysql MVCC机制 && 主从复制三大模式,第2张

事务隔离级别与MVCC的关系

  • REPEATABLE READ(可重复读) REPEATABLE READ级别会使用MVCC,只有在第一次进行快照读会生成read view,之后的快照读都会沿用第一次生成的read view,所以每次快照读读到的数据都是一样的,这样就可以解决脏读问题以及快照读的不可重复读、幻读问题。

这就是上面说的,只能读开启事务前提交的数据和当前事务修改的数据,其他情况都不会读到。

当前读与快照读

  • 当前读

像select lock in share mode(共享锁); select for update, update,delete,insert(排它锁)这些操作就是一种当前读,因为它读取的是数据的最新版本,读取时还要保证其他事务不能修改当前记录,会对记录进行加锁。

  • 快照读

不加锁的select就是快照读,即不加锁的非阻塞读;(快照读的前提是隔离级别不是串行化,串行化的隔离级别下快照读会退化成当前读) 之所以出现快照读的情况,是基于提高并发性能的考虑,快照读的实现是基于多版本并发控制,即MVCC,可以认为MVCC是行锁的一个变种,但是它在很多情况下避免了加锁操作,降低了开销,既然是基于多版本,所以快照读可能读到的不一定是数据的最新版本,而有可能是之前的历史版本

2、Mysql主从复制三大模式

sync :全同步

当主库执行完一个事务,所有的从库都执行了该事务才会将结果返回给客户端。这样保证了数据的安全性,但是因为需要等待所有从库执行完该事务才能返回客户端结果,所以全同步复制的性能必然会受到很大的影响。
对于全同步复制而言,当主库提交一个事务后,要求所有从库节点必须收到,执行并提交这些事务,然后主库线程才能继续做后续操作,而因此带来的问题就是主库完成一个事务的时间被大幅度拉长,性能降低。

async : 异步

主库在执行完客户端提交的事务后会立刻将执行结果返回给客户端,并不关心从库是否已经接收处理,这样带来的问题就是当主死掉了,此时主上提交的事务可能还没有传到从上。而强行将从提升为主就会导致新主上的数据不完整。

semi-sync : 半同步

介于异步复制和全同步复制之间,主库在执行完客户端提交的事务后不是立刻返回给客户端,而是等待至少一个从库接收并写到relay log中才返回给客户端。相对于异步复制,半同步复制提高了数据的安全性,同时也会造成一定程度的延迟,这个延迟为一个TCP/IP往返的时间。所以半同步复制需要在低延时的网络中使用。
对于半同步复制而言,是介于同步复制和异步复制之间的一种,主库需要等待至少一个从库节点收到并且刷新binlog到relay日志中,主库不需要等待所有从库给主库反馈,同时这里只是收到反馈而不死和完全执行并且提交事务的反馈,这样会节省很多的时间。

总结:实际业务中,一般都是配置使用半同步的,全同步高并发下有性能问题,异步有数据丢失的可能,所以,还是使用半同步。


https://www.xamrdz.com/database/6ur1995495.html

相关文章: