
数据
数据哇
开着奥迪卖小猪
走在成为大牛的路上!
展开
-
Kafka为什么吞吐量大、速度快?
本文参考:http://searene.me/2017/07/09/Why-is-Kafka-so-fast/ https://queue.acm.org/detail.cfm?id=1563874 Kafka是大数据领域无处不在的消息中间件,目前广泛使用在企业内部的实时数据管道,并帮助企业构建自己的流计算应用程序。 Kafka...原创 2019-09-28 02:01:32 · 17094 阅读 · 5 评论 -
Solr+Zookeeper 搭建搜索集群SolrCloud
目录一、简介1、SolrCloud是个什么玩意?2、Solr是个什么玩意?3、zookeeper是个什么玩意?4、实现负载均衡的方式: (Nginx、Redis槽、Zookeeper)二、SolrCloud的结构1、物理结构2、逻辑结构三、SolrCloud的搭建(3个zookeeper、4个solr)1、3台zookeeper搭建2、4台solr 实例...原创 2019-07-20 15:50:46 · 3645 阅读 · 1 评论 -
Kafka 与 Flume
一、Kafka与Flume比较1、Flume主要是为了发送数据给HDFS和HBase用的工具。 Flume集成了Hadoop的安全体系。 如果数据将被多个系统所消费,那么采用Kafka。 Kafka是一个更加通用的系统。 可以有很多数据的Producer和Consumer。 这些Consumer之间共享多个主题。2、Flume具有多个内置的源和sink...原创 2019-07-17 23:47:25 · 912 阅读 · 0 评论 -
Hadoop与Spark异同
Hadoop与Spark异同主要有以下10点:1、性能:当数据大小适于读入内存,尤其是在专用集群上时,Spark 表现更好;Hadoop MapReduce 适用于那些数据不能全部读入内存的情况,同时它还可以与其它服务同时运行。2、使用难度:Spark 更易于编程,同时也包含交互式模式;Hadoop MapReduce 不易编程但是现有的很多工具使其更易于使用。3、成本:根据基准...原创 2019-07-17 23:29:22 · 1325 阅读 · 0 评论 -
Google关于大数据的三篇著名论文 中文版
Google MapReduce 中文版 1.0版Google File System 中文版 1.0版Google Bigtable 中文版 1.0版转载 2017-06-19 11:23:36 · 849 阅读 · 0 评论