hadoop
闭眼神
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
flume核心概念及安装及使用
flume :实时日志收集系统。flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(比如文本、HDFS、Hbase等)的能力 。flume的基本数据单位:事件。flume的核心概念: Client:Client生产数据,运行在一个独立的线程...原创 2019-01-12 16:25:55 · 545 阅读 · 0 评论 -
kafka:基础知识,安装及使用
kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。这种动作(网页浏览,搜索和其他用户的行动)是在现代网络上的许多社会功能的一个关键因素。这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。 kafka名词解释producer:生产者。 consumer:消费者。 topic: 消息以topic为类别记录,Kafka将消息种子(F...原创 2019-01-13 10:35:49 · 209 阅读 · 0 评论 -
flume------kafka实战
Flume到Kafka 从图,我们已经清楚了数据生产的流程,下面我们来看看如何实现Flume到Kafka的输送过程,下面我用一个简要的图来说明,如下图所示: 这个表达了从Flume到Kafka的输送工程,下面我们来看看如何实现这部分。 首先,在我们完成这部分流程时,需要我们将Flume集群和Kafka集群都部署完成,在完成部署相关集群后,我们来配置Flume的Sink数据流向...原创 2019-01-13 11:02:17 · 267 阅读 · 0 评论 -
大数据框架:(电信诈骗实时查询框架)
框架图:flume:一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(比如文本、HDFS、Hbase等)的能力 kafka:一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。这种动作(网页浏览,搜索和其他用户的行动)是在现代网络上的...原创 2019-01-15 15:14:09 · 1701 阅读 · 1 评论
分享