
大数据相关
纸绘
这个作者很懒,什么都没留下…
展开
-
kafka学习笔记(一)-- -- 相关概念解释
首先,kafka是什么:kafka 是一个分布式消息队列系统,用于大数据分析,其中主要是日志分析系统:然后思考一下以下几个场景: 我想分析一下用户行为(pageviews),以便我能设计出更好的广告位 我想对用户的搜索关键词进行统计,分析出当前的流行趋势。这个很有意思,在经济学上有个长裙理论,就是说,如果长裙的销量高了,说明经济不景气了,因为姑娘们没钱买各种丝袜了。 ...原创 2018-08-23 13:25:49 · 291 阅读 · 0 评论 -
Kafka 学习笔记(二)--- topic命令行操作
上一篇介绍了kafka的特点,这篇来记录kafka的主要工作方式: 1.创建Topic, 2. 生产者生产 3.消费者消费首先 创建 一个 test topic, 命令如下:./kafka-topics.sh --zookeeper 172.28.201.217:2181 --create --topic test --replication-factor 2 --partitions...原创 2018-12-31 17:51:47 · 628 阅读 · 0 评论 -
流式处理 术语解释 Exactly-once与Effectively-once
分布式事件流处理已逐渐成为大数据领域的热点话题。该领域主要的流处理引擎(SPE)包括 Apache Storm、Apache Flink、Heron、Apache Kafka(Kafka Streams)以及 Apache Spark(Spark Streaming)等。处理语义是围绕 SPE 最受关注,讨论最多的话题之一,其中“严格一次(Exactly-once)”是很多引擎追求的目标之一,很多...转载 2019-01-01 08:35:33 · 11957 阅读 · 3 评论 -
ElasticSearch 索引查询使用指南——详细版
转自:https://www.cnblogs.com/pilihaotian/p/5830754.html 我们通常用用_catAPI检测集群是否健康。 确保9200端口号可用: curl 'localhost:9200/_cat/health?v' ...转载 2019-01-11 10:03:22 · 1187 阅读 · 0 评论 -
kafka 学习笔记(三)--- Consumer 参数设置(无加密的中高等级参数配置)
上一篇 介绍了kafka的命令行使用,这一篇主要介绍 Consumer 客户端的参数设置(搬运官网 http://kafka.apache.org/documentation/#consumerconfigs)kafka consumer 参数 意义及设置 名称 描述 类型 默认值 有效值 重要等级 key.deserializer key值 反序列化...翻译 2019-04-04 18:04:33 · 2166 阅读 · 0 评论