(1)如果需要毫秒级的响应,选择storm,其他所有的方面选择spark Streaming。
(2)Storm是一条一条处理的。处理的是新增的某一笔数据。spark Streaming是按照批次处理的,也就是按时间段进行处理的,与内容无关。
(3)Spark Streaming也是可以一条一条进行处理,需要一个机制,一般是利用kafka。数据来自不同的终端,推送给Kafka,kafka是最好的消息中间件,是一个集群,可以处理任意规模的数据,spark Streaming会从kafka中获取数据,进行处理。