使用Apache NiFi和Apache Kafka进行实时库存处理

最新推荐文章于 2025-02-13 17:50:35 发布

原创

最新推荐文章于 2025-02-13 17:50:35 发布 · 1.9k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文介绍了一个使用Apache NiFi和Apache Kafka进行实时库存处理的流式使用案例，涉及数据摄取、过滤、处理、存储等多个环节。通过NiFi将数据推送到Kafka，再存储到HDFS、Hive和Druid，同时利用Ambari、Schema Registry等工具进行管理和监控。还展示了如何将数据推送到Slack和进行数据可视化。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

使用Apache NiFi和Apache Kafka实现从REST到Hive的流式使用案例

第1部分

使用Apache Kafka 2.0和Apache NiFi 1.8，有许多新功能和新功能即将推出。是时候对它们进行测试了。

因此，为了规划我们将要做的事情，我有一个高级架构图。我们将提取许多来源，包括REST提要，社交资源，消息，图像，文档和关系数据。

我们将使用NiFi进行摄取，然后对其进行过滤，处理并将其细分为Kafka主题。Kafka数据将采用Apache Avro格式，并在Hortonworks Schema Registry中指定模式。Spark和NiFi将进行额外的事件处理以及机器学习和深度学习。这将存储在Druid中，用于实时分析和摘要。Hive，HDFS和S3将存储数据以进行永久存储。我们将使用Superset和Spark SQL + Zeppelin执行仪表板。

我们还将通过Kafka和NiFi向用户推送清理和汇总的数据。我们将推送到Dockerized应用程序，消息监听器，Web客户端，Slack通道和电子邮件列表。

为了在我们的企业中发挥作用，我们将通过Apache Ranger，Apache Atlas和Apache NiFi进行完全授权，身份验证，审计，数据加密和数据沿袭。NiFi Registry和GitHub将用于源代码控制。

我们将通过Apache Ambari提供管理功能。

示例服务器布局：

NiFi流量

IEX提供实时免费库存数据，无需许可证密钥。数据流速度非常快，幸好Apache NiFi和Kafka没有问题。

从主题中获取不同的记录并在单独的目录和表中存储到HDFS。

让我们将一个大的REST文件拆分成感兴趣的单个记录。我们的REST源包含引号，图表和新闻数组。

让我们把一些消息推到Slack

我们可以轻松地使用Apache NiFi中的多个主题。

由于我们有模式，因此在运动时查询数据很容易

我们为每个Kafka主题创建模式。

我们可以监控在Ambari中通过Kafka传递的所有这些消息（以及在Hortonworks SMM中更详细的信息）。

我读入数据然后可以将它推送到Kafka 1.0和2.0经纪人。

一旦发送数据，NiFi就会让我们知道。

使用的项目

Apache Kafka
Apache NiFi
阿帕奇德鲁伊
Kafka上的Apache Hive
Apache Hive on Druid
JDBC上的Apache Hive
Apache Zeppelin
NLP - Apache OpenNLP和Stanford CoreNLP
Horotnworks Schema Registry
NiFi注册表
Apache Ambari
日志搜索
Hortonworks SMM
Hortonworks数据平面服务（DPS）

来源

休息

水槽

Apache Hadoop HDFS
Apache Kafka
Apache Hive
松弛
S3
阿帕奇德鲁伊
Apache HBase

话题

iextradingnews
iextradingquote
iextradingchart
个股
网络

HDFS目录

hdfs dfs -mkdir  -p / iextradingnews

hdfs dfs -mkdir  -p / iextradingquote

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。