数仓元数据管理之Atlas简介与编译(2.1.0)

Apache Atlas是一款用于数仓元数据管理的框架,旨在解决复杂业务下数据库和表的梳理难题。本文介绍了Atlas的背景、功能,并详细阐述了如何编译2.1.0版本,包括配置Maven、修改依赖版本以及执行编译打包的步骤。通过内嵌或外置HBase和Solr,Atlas为大数据环境提供了有效的元数据解决方案。

数仓元数据管理之Atlas

1. 背景

  1. 在数仓开发中,由于数仓一般都会对数据做分层,ODS、DWD、DWS、ADS。每一层都会有众多数据库和数据库表,如果需要对这些数据库和表有一个较清晰梳理,仅仅使用文字,文档等工具管理是比较繁琐且低效的。
  2. 为什么需要对数仓中表和数据库做管理,因为当业务数据较多,业务变得复杂,并且数仓跟随业务迭代半年到一年之后,加上人员流动,文档不齐全等原因,数仓中表,数据库及其之间关系就会变得很难直观理解,很难梳理出清晰关系。这对于后续的数仓开发和维护是很不利的。
  3. 前期很多公司一般不会使用软件专门做这个数仓中数据库和数据表的管理,也就是数仓的元数据管理。但随着规模和业务复杂化之后,之前使用文档,表格等工具来管理,就变得很复杂且低效了。
  4. atlas这类数仓元数据管理框架应运而生

2. atlas简介

  1. 官网https://atlas.apache.org/#/
    在这里插入图片描述
  2. atlas就是用来做元数据管理的的框架,可以看出本身是一个java web项目,归属于apache。
  3. 注意,这是apache项目,本身和apache生态下的hadoop全家桶兼容性很好,官方文档中可以看出

3. atlas编译

  1. 在官网下载源码
    https://atlas.apache.org/#/Downloads
    在这里插入图片描述

注意,不提供安装包,需要自行下载源码进行编译打包

  1. 将下载好的源码压缩包上传到linux,解压

tar -zxf apache-atlas-2.01.0-sources.tar.gz -C /opt/app/

注意,需要先安装maven,因为这是使用maven开发的java web工程。maven3.6.3版本即可
配置好maven的环境变量
注意国内需要

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值