
大数据组件
文章平均质量分 96
-
G皮T
计算机科学与技术本科,计算机技术硕士,现任职于某互联网公司,担任测试开发工程师。优快云云原生领域优质创作者、博客专家。书籍《大数据测试开发工程师的第一本书》正在积极撰写中,敬请期待。微信公众号:大数据与AI实验室。《Java 百“练”成钢》连载中,欢迎关注!
展开
-
【HBase】HBase 中的列和列族
HBase 的每一个行都是离散的,因为列族的存在,所以一个行里不同的列甚至被分配到了不同的服务器上。行的概念被减弱到了一个抽象的存在。在实体上,把多个列定义为一个行的关键词 RowKey,也就是行这个概念在 HBase 中的唯一体验。原创 2023-12-02 14:38:23 · 4811 阅读 · 1 评论 -
【Linkis】打通上层应用与底层计算引擎的数据中间件 Linkis
Linkis 基于微服务架构,提供了金融级多租户隔离、资源管控、权限隔离等企业级特性,支持统一变量、UDF、函数、用户资源文件管理,具备高并发、高性能、高可用的大数据作业 / 请求全生命周期管理能力。原创 2023-08-22 23:41:42 · 1463 阅读 · 2 评论 -
【Kerberos】图解 Kerberos:身份认证
Kerberos 是一种身份认证协议,被广泛运用在大数据生态中,甚至可以说是大数据身份认证的事实标准。本文将详细说明 Kerberos 原理。原创 2023-09-06 23:01:18 · 5145 阅读 · 1 评论 -
【Knox】Apache Knox 概述
总之,Apache Knox 是一个强大的工具,具有 Apache Ranger 审核功能,可以过滤和审核对您环境的所有访问。但它也允许您通过配置的方式作为您的各种个性化服务面前的经典网关。例如,您可以在没有 Kerberos 身份验证的 REST API 前面添加它。原创 2024-04-15 12:39:02 · 2486 阅读 · 0 评论 -
【Ranger】利用 Apache Ranger 管理 Amazon EMR 中的数据权限
系统安全通常包括两个核心主题:身份验证和授权。一个解决 “用户是谁” 的问题,另一个解决 “用户允许执行什么操作” 的问题。在大数据领域,Apache Ranger 是最受欢迎的授权选择之一,它支持所有主流大数据组件,包括 HDFS、 Hive、HBase、 Trino 等组件。原创 2024-05-01 18:09:43 · 1501 阅读 · 3 评论 -
【LDAP】LDAP 和 AD 介绍及使用 LDAP 操作 AD 域
LDAP 也可以说成是一种数据库,也有 Client 端和 Server 端。Server 端是用来存放数据,Client 端用于操作增删改查等操作,通常说的 LDAP 是指运行这个数据库的服务器。只不过,LDAP 数据库结构为树结构,数据存储在叶子节点上。原创 2024-05-02 12:43:49 · 6548 阅读 · 1 评论 -
【Kyuubi】Apache Kyuubi 1.8 特性解读
Apache Kyuubi 是一个构建在 Spark、Flink、Trino 等计算引擎之上的,分布式、多租户的企业级大数据网关,致力于在 Lakehouse 之上提供 Serverless SQL 服务。Kyuubi 支持多种类型的工作负载。典型的使用场景包括:用户可以使用 JDBC / BeeLine 以及各种 BI 工具,连接 Kyuubi 进行交互式的数据分析;使用 RESRful API 向 Kyuubi 提交 SQL / Python / Scala / Jar 批作业。原创 2024-04-21 17:46:31 · 3093 阅读 · 1 评论