版本：2.5.3

事务模式

聚合根的本地事务解析

在介绍分布式事务具体之前，先剖析一下 phoenix 中实体聚合根的本地事务。

在Phoenix当中，实体聚合根是最小的逻辑处理单元，一个Phoenix集群会有N多个实体聚合根对象，每个实体聚合根对象在处理消息时都满足事务中ACID的特性，下面解析一下实体聚合根对ACID的支持能力。

特性	支持级别	实现原理
原子性（Atomicity）	支持	实体聚合根处理消息修改多个状态时，可以保证要么全部成功要么全部失败。
一致性（Consistency）	支持	实体聚合根处理消息是有序处理的，对于每个消息处理时，状态是线性一致的。
隔离性（Isolation）	支持	实体聚合根处理消息是有序处理的，隔离级别是最高（串行化）。
持久性（Durability）	支持	实体聚合根的状态依赖EventStore存储，依赖EventSouring技术恢复。

分布式事务产生的背景

在Phoenix当中，业务是实体聚合根处理的，实体聚合根都有一个唯一id标识(聚合根id)，一个实体聚合根内部处理消息时满足事务的ACID特性。但业务系统使用Phoenix开发服务时，会对业务做水平和服务化拆分成不同的聚合根，如果一个业务请求需要多个聚合根一起完成的话，就引出了分布式事务。

实体聚合根水平拆分

在使用Phoenix框架时，为了追求并发粒度来承担更大的业务体量，会对一个聚合根做水平拆分，通常一个聚合根类通过不同的聚合根id来生成不同的聚合根对象，那么不同的聚合根对象运行时会在不同的节点当中。如下图所示，一个账户聚合根通过账户id来生成了N个聚合根对象，这些聚合根对象运行在不同的节点当中，如果发起账户1对账户2的转账请求，则会涉及到分布式事务场景。

备注

实际上账户1向账户3转账也是一个分布式事务，虽然这两个实体聚合根对象在一个节点上，但是phoenix是无服务化的思想，一切都以聚合根隔离。

show

实体聚合根服务化拆分

在使用Phoenix框架时，会进行DDD领域设计出不同类型的聚合根，比如商品购物业务场景可以划分为商品仓储和资金账户两类聚合根，不同类别聚合根会协作完成购物的流程，这样则会涉及分布式事务的场景。

show

分布式事务理论基础

XA协议

XA协议是一个基于数据库的分布式事务协议，其分为两部分：事务管理器和本地资源管理器。事务管理器作为一个全局的调度者，负责对各个本地资源管理器进行统一提交或者回滚。二阶提交协议（2PC）和三阶提交协议（3PC）就是根据此协议衍生出来而来。如今Oracle、Mysql等数据库均已实现了XA接口。

2PC协议流程图 show

上边图片源自网络，如有侵权联系删除

实际上无论是2PC还是3PC协议都尝试在满足比较强的ACID特性，但是付出的代价也很高，就是性能很慢，阻塞同步等等。实际上3PC也存在数据不一致的问题，这里就不再阐述。

XA协议是站在关系型数据库维度提出的，应用在DB层面，并且旨在做到对用户透明，ACID的保障等。现在场景一般习惯在用户层面解决分布式事务问题的话，可以使用TCC和SAGA，虽然丧失了一些隔离性和一致性但是可以做到无锁，非阻塞。

TCC协议

TCC（Try-Confirm-Cancel）实际上是服务化的两阶段提交协议，业务开发者需要实现这三个服务接口，第一阶段由业务代码编排来调用 Try 接口进行资源预留，所有参与者的 Try 接口都成功了，事务管理器会提交事务，并调用每个参与者的 Confirm 接口真正提交业务操作，否则调用每个参与者的 Cancel 接口回滚事务。

Try阶段：下单时通过Try操作去扣除库存预留资源。
Confirm阶段：确认执行业务操作，在只预留的资源基础上，发起购买请求。
Cancel阶段：只要涉及到的相关业务中，有一个业务方预留资源未成功，则取消所有业务资源的预留请求。

理论上Confirm阶段和Cancel阶段不允许出现业务型失败，框架实现时要保证幂等，超时重试，超时回滚，空回滚，悬挂等一系列问题，后文会详细介绍Phoenix的实现。

show

TCC对于ACID的保证:

原子性：正常情况下保证。
一致性：最终一致性，可能出现A本地事务和B本地事务不一致的情况。
隔离性：不保证，在某个时间点会出现一个事务看到另外一个事务的中间结果。
持久性：和本地事务一样，只要分布式事务结束，则会被持久化。

Saga协议

1987年普林斯顿大学Hector & Kenneth发表论文Sagas，Saga是一个长活事务可被分解成可以交错云运行的子事务集合，其中每个子事务都是一个保持一致性的真实事务。

每个Saga都由一系列的sub-transaction Ti组成。
每个Ti都对应有补偿的动作Ci，补偿动作用户撤销Ti造成的结果。
理论上Ci执行不能失败，如果失败则需要人工介入，实现时要保证Ti-Ci和Ci->Ti执行结果都是一样（事务被回滚了）。

Ti和Ci也同样是用户定义的，可以看到和TCC相比，Saga没有预留动作，它的Ti就是直接提交子事务，这也同时要求业务场景要满足可以撤销的场景，比如火箭发射就不能撤销，或者资金管理中Ti不能直接用于加钱操作，不然也有可能不能撤销（加的钱被别的事务用了）。

show

Saga事务对于ACID的保证和TCC一样，实际上用户层面的分布式事务解决方案都不能保证隔离性，需要用户根据业务去衡量。

Phoenix Transaction详解

Phoenix Transaction是Phoenix框架在分布式事务场景下协调多个聚合根共同完成一个事务的实现，目前框架支持TCC和Saga两种事务模型，同时也支持混用(一个事务包含TCC和Saga两种子事务)。

TCC模式

TCC模式需要用户根据自己的业务场景实现 Try、Confirm 和 Cancel 三个操作。事务聚合根在一阶段执行 Try 方式，在二阶段提交执行 Confirm 方法，二阶段回滚执行 Cancel 方法。

TCC模式中Confirm和Cancel不允许出现处理失败的返回结果，不然整个事务会进入异常状态，需要人工处理。

show

可以参考使用文档定义事务聚合根并设置TCC命令。

TCC 设计 - 业务模型分 2 阶段设计

用户接入 TCC ，最重要的是考虑如何将自己的业务模型拆成两阶段来实现。

以扣钱场景为例，在接入 TCC 前，对 A 账户的扣钱，只需一条更新账户余额的 SQL 便能完成；但是在接入 TCC 之后，用户就需要考虑如何将原来一步就能完成的扣钱操作，拆成两阶段，实现成三个方法，并且保证一阶段 Try 成功的话二阶段 Confirm 一定能成功。

show

图片来源，该段落也参考了Seata

如上图所示，

Try 方法作为一阶段准备方法，需要做资源的检查和预留。在扣钱场景下，Try 要做的事情是就是检查账户余额是否充足，预留转账资金，预留的方式就是冻结 A 账户的转账资金。Try 方法执行之后，账号 A 余额虽然还是 100，但是其中 30 元已经被冻结了，不能被其他事务使用。

二阶段 Confirm 方法执行真正的扣钱操作。Confirm 会使用 Try 阶段冻结的资金，执行账号扣款。Confirm 方法执行之后，账号 A 在一阶段中冻结的 30 元已经被扣除，账号 A 余额变成 70 元。

如果二阶段是回滚的话，就需要在 Cancel 方法内释放一阶段 Try 冻结的 30 元，使账号 A 的回到初始状态，100 元全部可用。

用户接入TCC模式，最重要的事情就是考虑如何将业务模型拆成 2 阶段，实现成 TCC 的 3 个方法，并且保证 Try 成功 Confirm 一定能成功。

Phoenix Transaction的TCC模式集群中实际使用时需要注意一下几个事项。

超时场景
幂等控制
空回滚
防悬挂

超时场景

Phoenix在集群状态运行时，网络是不可靠的，可能遇到网络超时，消息丢失等各种异常场景。这种情况会导致Try，Confirm，Cancel命令得不到处理，进而整个事务不能结束。

Phoenix Transaction在处理超时场景时的策略是：每秒向前重试，并达到一定次数时回滚或者进入异常。如果用户需要一直向前恢复，则设置Try或者Ti阶段的重试次数为Integer.MAX_VALUE。

命令类型	超时策略
Try	重试N次后会驱动整个事务进行回滚(Cancel)
Confirm	重试N次后事务进入异常，提醒人工介入
Cancel	重试N次后事务进入异常，提醒人工介入

用户可在设置命令时设置命令对应的重试次数，一般ConfirmCmd和CancelCmd的超时次数要大一些。

 TccAction.builder()
         .tryCmd(new AccountTryCmd(request.getAccountCode(), frozenAmt))
         .confirmCmd(
                 new AccountConfirmCmd(request.getAccountCode(), frozenAmt))
         .cancelCmd(
                 new AccountCancelCmd(request.getAccountCode(), frozenAmt))
         .tryMaxRetryNum(2)
         .confirmRetryNum(3)
         .cancelRetryNum(3)

幂等控制

上述介绍了超时重试，那么Phoenix是要支持幂等控制才可以，不然就会重复处理消息。Phoenix框架原生是支持幂等的，可以参考文档实体聚合根

空回滚

Cancel命令的处理要允许空回滚，在Try命令超时后事务会进入回滚状态(Try命令丢失)，这时会触发发送Cancel命令，这时如果执行了Cancel命令就会导致数据不一致。

Phoenix的实体聚合根在收到Cancel命令时会判断如果处理过Try才会执行，不然则会插入一条假的Try命令并且返回回滚成功。同理，对于Saga模式一样，在收到Ci的时候，如果没有Ti处理过，则回插入一条假的Ci命令标识并且返回回滚成功。

备注

插入一条假的命令主要是为了解决悬挂问题。

防悬挂

悬挂是指回滚命令先与处理命令到达，比如TCC中Cancel先于Try到达，Saga中Ci先于Ti到达，该场景下的处理结果都应当是回滚成功。上文提到，在回滚命令先于处理命令到达时会产生一个假的处理命令标记，当真的处理命令再来会被幂等掉。

Saga模式

Phoenix Transaction也提供了Saga模式的原生支持，Saga模式与TCC模式最大的不同在于没有预留动作阶段了，这样也要求用户使用时要考虑业务场景是否合理。比如加钱场景就不合理，没有冻结这一阶段会出现钱在Ti阶段加上了但是在Ci时钱不够(因为Saga事务是没有隔离性的，会被别的事务用到)。

Saga模式中Ci的执行不允许出现处理失败的返回结果，不然整个事务会进入异常状态，需要人工处理。实现时要保证Ti-Ci和Ci->Ti执行结果都是一样（事务被回滚了），参考防悬挂和空回滚的介绍。

show

可以参考使用文档定义事务聚合根并设置Saga命令。

Phoenix Transaction的Saga模式集群中实际使用时同样需要注意一下几个事项，参考上文描述。

超时场景
幂等控制
空回滚
防悬挂

混用模式

无论是Saga模式还是TCC模式实则都是二阶段提交的业务层实现，Phoenix事务模块实则是把一个TCC或者Saga事务当做子事务，由N个TCC和Saga组成的分布式事务当做大事务。子事务会的变化会驱动大事务的状态更新，大事务则会调度子事务从一阶段进入二阶段。

TCC和Saga的一阶段和二阶段是可以匹配起来的。

事务名称	一阶段	二阶段
TCC	Try	Confirm or Cancel
Saga	Ti	null or Ci

所以在实际使用场景中，可以支持一个事务聚合根同时包含TCC和Saga的处理。

    @TransactionStart
    public TransactionReturn on(BuyGoodsCmd request) {
        this.request = request;
        double frozenAmt = request.getQty() * request.getPrice();
        return TransactionReturn.builder()
                 // TCC子事务
                .addAction(
                        TccAction.builder()
                                .tryCmd(new AccountTryCmd(request.getAccountCode(), frozenAmt))
                                .confirmCmd(
                                        new AccountConfirmCmd(request.getAccountCode(), frozenAmt))
                                .cancelCmd(
                                        new AccountCancelCmd(request.getAccountCode(), frozenAmt))
                                .build())
                 // Saga子事务
                .addAction(
                        SagaAction.builder()
                                .targetTopic("")
                                .tiCmd(new GoodsSellCmd(request.getGoodsCode(), request.getQty()))
                                .ciCmd(
                                        new GoodsSellCompensateCmd(
                                                request.getGoodsCode(), request.getQty()))
                                .build())
                .build();
    }

总结展望

本文先分析了Phoenix的实体聚合根的本地事务，又分别介绍了Phoenix出现分布式事务的场景以及理论基础，然后重点介绍了Phoenix事务聚合根的原理和使用场景。

Phoenix作为一款DDD开发框架，本地事务的处理并没有依赖关系型数据库，所以分布式事务自然从业务框架层面解决，当然这也是目前多数场景使用的方案，柔性事务的好处是远远大于刚性事务的。

聚合根的本地事务解析​

分布式事务产生的背景​

实体聚合根水平拆分​

实体聚合根服务化拆分​

分布式事务理论基础​

XA协议​

TCC协议​

Saga协议​

Phoenix Transaction详解​

TCC模式​

TCC 设计 - 业务模型分 2 阶段设计​

超时场景​

幂等控制​

空回滚​

防悬挂​

Saga模式​

混用模式​

总结展望​

聚合根的本地事务解析

分布式事务产生的背景

实体聚合根水平拆分

实体聚合根服务化拆分

分布式事务理论基础

XA协议

TCC协议

Saga协议

Phoenix Transaction详解

TCC模式

TCC 设计 - 业务模型分 2 阶段设计

超时场景

幂等控制

空回滚

防悬挂

Saga模式

混用模式

总结展望