
大数据
素黑明
这个作者很懒,什么都没留下…
展开
-
Kafka基本原理及基本使用
Kafka架构包括以下组件:话题(Topic):是特定类型的消息流。消息是字节的有效负载(Payload),话题是消息的分类名或种子(Feed)名。生产者(Producer):是能够发布消息到话题的任何对象。服务代理(Broker):已发布的消息保存在一组服务器中,它们被称为代理(Broker)或Kafka集群。消费者(Consumer):可以订阅一个或多个话题,并从Broker拉...原创 2019-07-14 17:26:19 · 396 阅读 · 2 评论 -
impala使用及调优
Impala是基于Hive的大数据实时分析查询引擎,直接使用Hive的元数据库Metadata,意味着impala元数据都存储在Hive的metastore中。Hive适合于长时间的批处理查询分析,而Impala适合于实时交互式SQL查询。在impala中一条SQL语句先后经历BeeswaxService.Query->TClientRequest->TExecRequest,...原创 2019-07-14 17:36:23 · 1785 阅读 · 0 评论