storm学习笔记

本文深入解析了Storm集群的并发机制,介绍了topology发布过程及序列化机制,并详细阐述了Node、worker、executor和task等核心概念及其作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

topology发布

当topology发布时,所有的bolt和spout组件首先会进行序列化,然后通过网络发送到集群中.如果spout和bolt在序列化之前(比如在构造函数中生成)实例化了任何无法序列化的实例变量,在进行序列化时会抛出NotSerializableException异常.

storm并发

storm集群在并发运行时,有以下四个组成部分:

  • Node(服务器)
    storm集群中的一台服务器,会运行topology中的一部分运算.一个集群会包括一个或者多个node.
  • worker(jvm虚拟机)
    指一个node上相互独立运行的jvm进程.每个node可以配置运行一个或者多个worker.
  • executer(线程)
    指一个worker的jvm进程中运行的java线程.多个task可以指派给同一个executer执行.除非是明确指定,storm默认会给每个executor分配一个task.
  • task(bolt/spout实例)
    task是spout和bolt实例,它们的nextTuple()和execute()方法会被executor执行.

一个或多个woker执行一个topology,一个executer执行一个task.

storm的task实际上可以认为是一个实例,executor只是一个实际的执行体.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值