随着公司数据量的增多,Hive表已经有近千个,为了方便使用和管理,这时候需要一个“元数据管理系统”。
经过搜索,目前开源的Apache Atlas比较符合要求,准备搭建起来试试
网上有很多入门的文章,官网也有介绍,但是…
花了快一天的时间竟然没运行起来!
编译耗时很久,报错…
依赖Zookeeper,Hbase,Solr…
只需要管理下元数据要这么复杂吗?
看了下源码,主项目下面有一堆子项目,子项目里还有子项目…
应该有个精简版,能快速上手,然后根据需要逐步增加复杂的功能
github搜索“compact-atlas”,找到spring-boot版本的atlas
mvn package, java -jar执行,搞定!
面对众多Hive表的管理挑战,作者尝试使用Apache Atlas作为元数据解决方案。然而,标准版的Apache Atlas在安装过程中遭遇了编译耗时长和依赖多的问题。作者在寻找简化版的过程中,发现了Spring-Boot版本的Atlas,通过简单的mvn package和java-jar命令,成功实现了快速部署。
841

被折叠的 条评论
为什么被折叠?



