Storm事务基本原理分为三个阶段:
第一阶段:每一个tuple都有一个tid,一直到数据库,仅当第一个执行完之后才会执行第二个
第二阶段:每批次给一个tid,一批次一批次的执行,按批次提交,按批次提交效率较高
如果当前的事务没有提交到数据库,后边的就不允许处理
缺点是造成了资源的浪费,相当于hadoop中的federation情况
第三阶段:多个节点并行,但依然是强有序性,tuple不是简单的几百几千,要求绝对准确性。
消费的时候,可以设置不从头开始。不用设置from beginning