实时数据处理也就这么个玩法

本文介绍了一种基于Python、Logstash、Kafka、Storm、HBase、Zookeeper和SpringBoot的实时数据处理架构。该架构适用于实时推荐和实时展示场景,通过Python分析热数据并格式化输入Kafka,Storm进行实时数据处理,最终将结果存储于HBase或MySQL供UI实时抽取显示。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前奏:Storm实时处理框架​​(一)

hadoop 集群搭建(一)

hadoop 集群搭建(二)

hbase(一) 伪集群搭建​​​​​​​

自从AI的概念火起来之后,不玩玩实时 ,而只知道离线处理数据,似乎已经不满足现在对数据分析的要求了,深感逗比的同时,哥们还是浅浅介绍一下实时需要掌握的技巧和核心点,架构图请自己画切。
 

 技术支持:

        python + logstash + kafka + storm + hbase ( mysql )+ zookeeper + springboot + js + css + 高德map插件

 

 

核心要点:

    python 分析热数据到 logstash 格式化灌入 kafka  ,storm 实时分析数据  落地 hbase 或 mysql, ui实时抽取实时数据表现到高德地图中即可

 

心得: 面对实时性较强 (比如实时推荐、实时展现),而非离线操作的业务,甚至可以干掉hbase以直接面向结果的方式进行 , 但是storm 处理完的结果 必须先落地到某个地方,再交给机器学习 ,如果不想落地咋办? 此时可以采用 spark streaming & ml lib  s[图片]park sql 结合的方式进行 流水式推荐 ,待下回分解。

 
想对AI有所建树,不学python,只是粗略掌握一套别人提供的架构,粗浅的开发开发就想装个逼,哥们介意还是别在这上边浪费时间了,

基于一通百通的原则,学数据架构会那么一套两套就差不多了,最重要的还是语言基础和算法分析。

欢迎互粉交流     春叁十娘

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值