5、流式系统的数据处理与消息队列技术解析

流式系统的数据处理与消息队列技术解析

1. 容错日志技术

在流式系统中,容错日志技术对于数据保护至关重要。主要有基于接收方的消息日志(RBML)和基于发送方的消息日志(SBML)两种方式,而混合消息日志(HML)则是为平衡两者优缺点而设计的。

1.1 基于接收方的消息日志(RBML)

RBML 技术会在对收到的每条消息采取任何操作之前,将其同步写入稳定存储。这样做的好处是,当软件在处理消息时崩溃,消息已被保存,恢复后可以重新播放该消息。

1.1.1 正常数据流程

正常情况下,消息流程如下:
1. 数据生产者(任何客户端)发送消息。
2. 为收集节点编写的 RBML 记录器从数据生产者获取消息并发送到存储。
3. 消息被写入稳定存储。
4. 消息经过节点中的其他逻辑处理,如丰富数据、过滤或根据业务规则路由。
5. 消息被发送到消息队列层,即流式系统的下一层。

graph LR
    A[数据生产者] -->|发送消息| B[RBML记录器]
    B -->|发送到存储| C[稳定存储]
    C -->|经过逻辑处理| D[节点逻辑]
    D -->|发送消息| E[消息队列层]

不过,根据所使用的稳定存储类型,步骤 2 和 3 可能会对收集节点的吞吐量性能产生负面影响,这也是日志协议的一个缺点。

1.1.2 恢复数据流程

当发生崩溃时,恢复流程如下:
1. 停止向该收集节点的

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值