延时任务队列-单机支持每秒10万延时消息高效触发（可部署多台提供更高并发）

最新推荐文章于 2023-04-18 17:56:26 发布

原创最新推荐文章于 2023-04-18 17:56:26 发布 · 9.4k 阅读

18 ·

CC 4.0 BY-SA版权

文章标签：

#延迟队列 #架构师

架构和设计模式专栏收录该内容

62 篇文章

订阅专栏

本文探讨了多种延时队列实现方案，包括定时扫描表、Redis、Java DelayQueue、消息队列等，并分析了各自的优缺点。最终提出了自行实现轻量级延时队列的想法。

本文方案是看了58的一位架构师的分享，但并没有实现细节。本文是对方案的深入研究及代码实现

业务场景

1.下单之后如果三十分钟之内或12小时没有付款就自动取消订单

2.下单成功后60s之后给用户发送短信通知

3.用户希望通过手机远程遥控家里的智能设备在指定的时间进行工作。这时候就可以将用户指令发送到延时队列，当指令设定的时间到了再将指令推送到只能设备。

4. 七天自动收货

5.一定时间后自动评价

6.业务执行失败之后隔10分钟重试一次

…….

吐舌头本质都是过一段时间后才执行任务

下单成功后60s之后给用户发送短信通知为例。

方案一: 定时扫描表

实现：启动一个定时任务，每分钟查一次数据库表，把下单成功超过60秒并且没有发过短信通知的的取出来，然后去处理。

缺点：
1.如果数据量很大，查表轮询效率就低。
2.每分钟轮询一次增加了数据库压力。
3.如果是增大轮询时间间隔，那么时效性（准确性）又降低了

方案二: redis

实现：通过zset机构模拟，定时器去读zset数据去处理。

不足：

1.数据量大，一zset性能有问题。当然可以多定义几个zset，再数据量大的时候分散到不同zset里面，但存和定时器去读的复杂性增加了。
2.消息处理失败是不能被恢复。也有考虑过将分为TODO和Doing两条队列。但是由于Redis的事务特性，并不能做到完全可靠；并且检查Doing超时的逻辑也略复杂
并不是成熟方案，需要自己去实现。

方案三: JAVA DelayQueue

实现：DelayQueue本身就是延迟队列

不足：

1.通过先将消息排序再定时触发的方式来实现延迟消息。所以大量消息时，性能不能保证
2.想提供一定可靠性（如数据持久性），扩展性不方便
3.分布式需要额外实现

方案四: MQ

实现：老版本的MQ大多没有延时队列的实现。
不过现在新版本慢慢有了延时投递的功能。
如：ActiveMQ 可以延时投递，但有人测试在往队列中投递大量（10w+）定时消息之后，ActiveMQ的性能将会变得接近不可用，大量的消息挤压得不到投递,可多机。
RocketMQ 支持定时消息，但是不支持任意时间精度，支持特定的level，例如定时5s，10s，1m等。
RabbitMQ 通过他的一些特性也可以模拟出延迟队列的功能，或者有一些第三方插件

完善的MQ系统可实现一个高可靠的分布式延迟消息队列。仍在发展中，但还没有完全比较专用的延迟消息功能

方案五: 自己实现延时MQ
有能力可以做，mq实现起来还是耗费资源的

方案六: 自己实现延时队列

我们自己实现轻量级的延时队列。

初级版本目标：
网络或down机允许消息丢失。即业务完整性不保证
支持高并发
不提供客户端

只做一个内嵌的jar,不单独做一个成品应用服务

源码：https://gitee.com/itman666/wheel-timer-queue

详细介绍请看wiki:　https://gitee.com/itman666/wheel-timer-queue/wikis/Home

5 条评论

q719136246 2020.11.19
这不就是时间轮吗

iwin32 2018.08.14
方案六: 自己实现延时队列这个是单机的方案吧？
- sp42a回复迷彩的博客 2024.12.11
  作者哪里说了？貌似没看到
- iwin32回复迷彩的博客 2020.01.13
  [reply]sxdtzhaoxinguo[/reply]我们回到问题本身，我对作者文章的理解是：队列环在一台机器；这是阅读文章后的思考和求证。我想知道的是：如果多机，作者的方案和思考是怎样？
- 迷彩的博客回复iwin32 2019.10.12
  [reply]iwin32[/reply] 作者不是说了吗，多机的话，只要保证taskId全局唯一就行！