
大数据
文章平均质量分 90
Danielka
这个作者很懒,什么都没留下…
展开
-
Kafka基本概念
3个特点发布(写)和订阅(读)事件流,包括连续地将数据从其他系统输入和输出。可以如你想要的那样长时间的、可靠地、经久地存储事件流。在事件发生时或回顾时处理事件流。组成服务端一些服务端来自储存层,被称为brokers另一些运行 Kafka Connect来持续地输入和输出数据作为事件流使得Kafka可以与现有的如关系型数据库、或是其他kafka集群相整合。...原创 2022-04-15 19:01:28 · 1912 阅读 · 0 评论 -
Apache Impala
1. 简介Impala 是Hadoop生态中的一个开源的、原生的分析数据库。它的作用:在Hadoop上做BI查询Impala时延低、高并行的特点,非常适合做分析查询。弥补只能做批处理的Hive的不足。Impala支持多租户线性扩展。统一的基础架构使用Hadoop集群相同的文件、数据格式、元数据、安全、资源管理框架。不需要改变基础架构和做数据迁移备份。快速的处理能力使用和Hive相同的元数据和ODBC驱动。同样支持SQL,上手容易不用造轮子。企业级安全Impala与原生Hadoop安全原创 2022-04-11 18:40:14 · 530 阅读 · 0 评论