【流式计算】Twitter Storm源代码分析之Tuple是如何发送的

本文详细解析了Twitter Storm中Tuple的创建与传输流程,包括Bolt如何生成Tuple、Tuple如何被放入发送队列并最终通过ZeroMQ进行传输。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

作者: xumingming | 可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明
网址: http://xumingming.sinaapp.com/727/twitter-storm-code-analysis-tuple-send-proc/

 
这篇文章里面我们来看一下Storm里面的tuple到底是如何从一个tuple是怎么从一个bolt到另一个bolt上去的。

首先Bolt在发射一个tuple的时候是调用OutputCollector的emit或者emitDirect方法,
而这两个方法最终调用的是clojure代码里面的mk-transfer-fn方法:

1
2
3
4
5
6
; worker.clj
( defn mk-transfer- fn [ transfer-queue ]
   ( fn [ task ^Tuple tuple ]
     (.put ^LinkedBlockingQueue
           transfer-queue [ task tuple ] )
     ))

这个方法其实只是往一个LinkedBlockingQueue里面放入一条新记录(task-id, tuple)
然后这个queue里面的内容会被下面这段代码处理

01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
; worker.clj
; 这里面的这个socket到底是什么东西?
(async- loop
     ( fn [ ^ArrayList drainer
          ^KryoTupleSerializer serializer ]
       ; 从transfer-queue里面取出一个任务来
       ; 这个任务其实就是(task, tuple)
       ( let [ felem (. take transfer-queue) ]
         (.add drainer felem)
         (.drainTo transfer-queue drainer))
       (read-locked endpoint-socket-lock
         ; 获取从node+port到socket的映射
         ( let [ node+port->socket @node+port->socket
               ; 获取从task-id到node+port的映射
               task->node+port @task->node+port ]
           ( doseq [ [ task ^Tuple tuple ] drainer ]
             ; 获取task对应的socket
             ( let [ socket
                    (node+port->socket
                      (task->node+port task))
               ; 序列化这个tuple
               ser-tuple (.serialize serializer tuple) ]
               ; 发送这个tuple
               (msg/ send socket task ser-tuple)
               ))
           ))

从上面代码可见,tuple最终是被序列化之后由msg/send方法通过socket发送给指定的task的。注意上面代码里面的async-loop表示会创建一个单独的线程来执行这些代码。可以storm会起一个独立线程来专门发送待发送的消息的。

我们来看下这个socket到底是个怎么样的东西。这个socket是在worker.clj里面被初始化的,看下面的代码:

01
02
03
04
05
06
07
08
09
10
11
12
13
; socket(worker.clj)
(swap! node+port->socket
      merge
      (into {}
        (dofor
           [ [ node port :as endpoint ] new -connections ]
          [ endpoint
           (msg/connect
              mq-context
              (( :node- >host assignment) node)
              port)
           ]
          )))

从上面代码可以看出socket其实是msg/connect创建出来的。那 msg/connect到底在做什么呢? 这个方法是定义在protocol.clj里面的:

1
2
3
4
5
6
(defprotocol Context
   (bind [ context virtual-port ] )
   (connect [ context host port ] )
   ( send -local-task-empty [ context virtual-port ] )
   (term [ context ] )
   )

这里定义的只是一个接口而已,具体的实现是在zmq.clj里面。zmq是ZeroMQ的缩写, 可见storm的supervisor之间就是利用zeromq来传递tuple的。

zmq.clj里面的ZMQCOntext实现了Context接口:

01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
(deftype ZMQContext [ context linger-ms ipc? ]
   ; 实现Context接口
   Context
   ; 从给定的virtual-port拉消息
   (bind [ this virtual-port ]
     (-> context
         (mq/socket mq/pull)
         (mqvp/virtual-bind virtual-port)
         (ZMQConnection.)
         ))
   ; 给给定的host,port推送消息(push)
   (connect [ this host port ]
     ( let [ url ( if ipc?
                 ( str "ipc://" port "ipc" )
                 ( str "tcp://" host ":" port)) ]
       (-> context
           (mq/socket mq/push)
           (mq/ set -linger linger-ms)
           (mq/connect url)
           (ZMQConnection.))))
   ; 给本地的virtual-port发送一条空消息
   ( send -local-task-empty [ this virtual-port ]
     ( let [ pusher
            (-> context
                (mq/socket mq/push)
                (mqvp/virtual-connect virtual-port)) ]
           (mq/ send pusher (mq/barr))
           (.close pusher)))
   (term [ this ]
     (.term context))
   ; 实现ZMQContextQuery接口
   ZMQContextQuery
   (zmq-context [ this ]
     context))

总结一些Twitter Storm对于tuple的处理/创建过程:

  1. Bolt创建一个tuple。
  2. Worker把tuple, 以及这个tuple要发送的地址(task-id)组成一个对象(task-id, tuple)放进待发送队列(LinkedBlockingQueue).
  3. 一个单独的线程(async-loop所创建的线程)会取出发送队列里面的每个tuple来处理
    • Worker创建从当前task到目的task的zeromq连接。
    • 序列化这个tuple并且通过这个zeromq的连接来发送这个tuple。

资源下载链接为: https://pan.quark.cn/s/9648a1f24758 这个HTML文件是一个专门设计的网页,适合在告白或纪念日这样的特殊时刻送给女朋友,给她带来惊喜。它通过HTML技术,将普通文字转化为富有情感和创意的表达方式,让数字媒体也能传递深情。HTML(HyperText Markup Language)是构建网页的基础语言,通过标签描述网页结构和内容,让浏览器正确展示页面。在这个特效网页中,开发者可能使用了HTML5的新特性,比如音频、视频、Canvas画布或WebGL图形,来提升视觉效果和交互体验。 原本这个文件可能是基于ASP.NET技术构建的,其扩展名是“.aspx”。ASP.NET是微软开发的一个服务器端Web应用程序框架,支持多种编程语言(如C#或VB.NET)来编写动态网页。但为了在本地直接运行,不依赖服务器,开发者将其转换为纯静态的HTML格式,只需浏览器即可打开查看。 在使用这个HTML特效页时,建议使用Internet Explorer(IE)浏览器,因为一些老的或特定的网页特效可能只在IE上表现正常,尤其是那些依赖ActiveX控件或IE特有功能的页面。不过,由于IE逐渐被淘汰,现代网页可能不再对其进行优化,因此在其他现代浏览器上运行可能会出现问题。 压缩包内的文件“yangyisen0713-7561403-biaobai(html版本)_1598430618”是经过压缩的HTML文件,可能包含图片、CSS样式表和JavaScript脚本等资源。用户需要先解压,然后在浏览器中打开HTML文件,就能看到预设的告白或纪念日特效。 这个项目展示了HTML作为动态和互动内容载体的强大能力,也提醒我们,尽管技术在进步,但有时复古的方式(如使用IE浏览器)仍能唤起怀旧之情。在准备类似的个性化礼物时,掌握基本的HTML和网页制作技巧非常
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值