
Kafka
人生偌只如初见
学历代表过去,财力代表现在,学习力代表将来,所见所闻改变一生,不知不觉断送一生。
展开
-
Kafka学习笔记-基本概念与安装部署
Kafka是Linkedin开源的消息系统,它主要用于日志处理的分布式消息队列,处理活跃的流式数据。活跃的流式数据在网站应用中非常常见,这些数据包括网站的pv、用户行为(登录、浏览、点击、分享、喜欢等),搜索内容以及系统运行日志(CPU、内存、磁盘、网络、系统及进程状态)等。这些数据通常以日志的形式记录下来,然后每隔一段时间进行一次统计处理。传统的日志分析系统提供了一种离线处理日志信息的可...原创 2015-06-09 19:51:07 · 1136 阅读 · 0 评论 -
Kafka学习笔记-Java简单操作
Kafka学习笔记-Java简单操作原创 2015-06-13 23:10:54 · 10050 阅读 · 0 评论 -
Kafka学习笔记-Flume整合Kafka整合SparkStreaming
Flume Kafka 环境信息: apache-flume-1.6.0-bin.tar.gz kafka_2.11-0.10.0.0.tgz scala 2.11 1、启动Zookeeper(这里用的是Kafka自带的Zookeeper) $bin/zookeeper-server-start.sh -daemon config/zookeeper.properties原创 2016-06-22 17:45:44 · 1162 阅读 · 0 评论 -
JStorm学习笔记-基于Kafka、ElasticSearch、HBase简单实例
相关依赖如下: <hadoop.version>2.7.2</hadoop.version> <hbase.version>1.2.3</hbase.version> <kafka.version>0.10.0.0</kafka.version> <jstorm.version>2.2.1</jstorm...原创 2017-05-12 15:28:49 · 3592 阅读 · 3 评论 -
学习笔记-日志采集和实时分析简单实例
流程简述:Nginx生成的访问日志文件通过Filebeat采集输入到Kafka中,Kafka中数据流入Logstash,Logstash处理过滤数据。一个出口直接写到ElasticSearch,提供Kibana进行日志分析可视化处理;一个出口直接写到HDFS,提供后期离线统计分析处理;一个出口写入Kafka中,提供SparkStreaming进行近实时日志统计分析处理。具体配置操作记录如下: N...原创 2018-08-23 17:38:27 · 992 阅读 · 0 评论