二阶段提交（2PC）

在分布式环境下，所有节点进行事务提交，保持一致性的算法

前言

今天是2020年的元旦，在这先祝自己开心快乐

2PC 在之前学习 HBase Snapshot 时了解过，这次通过文档的记录的方式再过一遍

本人主要是阅读下方学习了解的

问题

2PC 是解决分布式系统中数据一致性问题，即分布式事务

为什么分布式事务为什么难？

在分布式环境下，每个节点都可以知晓自己操作的成功或者失败，却无法知道其他节点操作的成功或失败。当一个分布式事务跨多个节点时，保持事务的原子性与一致性，是非常困难的。

举个例子: 在电商网站下单的时候，需要有多个分布式服务同时服务，如支付系统进行支付、红包系统进行红包扣减、库存系统扣减库存、物流系统更新物流信息等。

但是，如果其中某一个系统在执行过程中失败了，或者由于网络原因没有收到请求，那么，整个系统可能就有不一致的现象了，
即：付了钱，扣了红包，但是库存没有扣减

概念

通过引入一个协调者（Coordinator）来统一掌控所有参与者（Participant）的操作结果，
并指示它们是否要把操作结果进行真正的提交（commit）或者回滚（rollback）

2PC分为两个阶段:

投票阶段（voting phase）参与者通知协调者，协调者反馈结果
提交阶段（commit phase）收到参与者的反馈后，协调者再向参与者发出通知，根据反馈情况决定各参与者是否要提交还是回滚

准备阶段

准备阶段分为以下三个步骤

协调者节点向所有参与者节点询问是否可以执行提交操作，并开始等待各参与者节点的响应
参与者节点执行询问发起为止的所有事务操作，并将Undo信息和Redo信息写入日志 (HBase SnapShot 是将执行操作写入到临时文件，回滚就直接删除，执行就移动到目标目录)
各参与者节点响应协调者节点发起的询问。如果参与者节点的事务操作实际执行成功，则它返回一个”OK”消息, 如果参与者节点的事务操作实际执行失败，则它返回一个”NO”消息

提交阶段

如果协调者收到了参与者的失败消息或者超时，直接给每个参与者发送回滚消息；否则，发送提交消息；参与者根据协调者的指令执行提交或者回滚操作

当协调者节点从所有参与者节点获得的相应消息都为”OK”时

协调者节点向所有参与者节点发出”正式提交”的请求
参与者节点正式完成操作，并释放在整个事务期间内占用的资源
参与者节点向协调者节点发送”完成”消息
协调者节点受到所有参与者节点反馈的”完成”消息后，完成事务

如果任一参与者节点在第一阶段返回的响应消息为”NO”时，或者协调者节点在第一阶段的询问超时之前无法获取所有参与者节点的响应消息时

协调者节点向所有参与者节点发出”回滚操作”的请求
参与者节点利用之前写入的Undo信息执行回滚，并释放在整个事务期间内占用的资源
参与者节点向协调者节点发送”回滚完成”消息
协调者节点受到所有参与者节点反馈的”回滚完成”消息后，取消事务

缺点

1、同步阻塞问题。执行过程中，所有参与节点都是事务阻塞型的。当参与者占有公共资源时，其他第三方节点访问公共资源不得不处于阻塞状态。

2、单点故障。由于协调者的重要性，一旦协调者发生故障。参与者会一直阻塞下去。尤其在第二阶段，协调者发生故障，那么所有的参与者还都处于锁定事务资源的状态中，而无法继续完成事务操作。（如果是协调者挂掉，可以重新选举一个协调者，但是无法解决因为协调者宕机导致的参与者处于阻塞状态的问题）

3、数据不一致。在二阶段提交的阶段二中，当协调者向参与者发送commit请求之后，发生了局部网络异常或者在发送commit请求过程中协调者发生了故障，这回导致只有一部分参与者接受到了commit请求。而在这部分参与者接到commit请求之后就会执行commit操作。但是其他部分未接到commit请求的机器则无法执行事务提交。于是整个分布式系统便出现了数据部一致性的现象。

4、二阶段无法解决的问题：协调者再发出commit消息之后宕机，而唯一接收到这条消息的参与者同时也宕机了。那么即使协调者通过选举协议产生了新的协调者，这条事务的状态也是不确定的，没人知道事务是否被已经提交。

扩展

漫话：如何给女朋友解释什么是3PC？

参考链接