〔从零搭建〕元数据管理平台部署指南

原创已于 2025-11-21 18:04:26 修改 · 1.5k 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#开源 #数据分析 #大数据 #java

于 2025-07-17 10:59:17 首次发布

【从零搭建】系列文章专栏收录该内容

21 篇文章

订阅专栏

🔥🔥 AllData大数据产品是可定义数据中台，以数据平台为底座，以数据中台为桥梁，以机器学习平台为中层框架，以大模型应用为上游产品，提供全链路数字化解决方案。
✨杭州奥零数据科技官网：http://www.aolingdata.com
✨AllData开源项目：https://github.com/alldatacenter/alldata
✨Gitee组织：https://gitee.com/alldatacenter

摘要：元数据管理平台基于开源项目OpenMetaData建设，能够帮助企业更好地理解和管理数据资产，提升数据质量和价值，支持数据驱动的决策和创新。文章内容主要为以下四部分:

一、在线演示环境
二、功能简介
三、源码编译部署安装
四、访问元数据管理平台页面

在这里插入图片描述
🔹AllData数据中台线上正式环境：http://43.138.156.44:5173/ui_moat/
请联系市场总监获取账号密码

在这里插入图片描述
2.1 元数据管理平台基于开源项目OpenMetaData建设

AllData数据中台元数据管理平台OpenMetaData通过全面的元数据采集、强大的存储与检索、深度的分析与治理、灵活的应用与共享、高扩展性与定制化以及直观的用户体验，为企业提供了一站式的元数据管理解决方案。该平台能够帮助企业更好地理解和管理数据资产，提升数据质量和价值，支持数据驱动的决策和创新。

🔹OpenMetaData开源项目：
https://github.com/open-metadata/OpenMetadata
🔹更多教程可以参考官方教程文档：
https://docs.open-metadata.org/latest

2.2 元数据管理平台功能特点：

全面的元数据采集与整合
强大的元数据存储与检索
深度的元数据分析与治理
灵活的元数据应用与共享
直观的用户体验

在这里插入图片描述
💡部署步骤：

3.1 环境准备

🔹操作系统要求：需准备Linux或macOS操作系统，为部署OpenMetaData提供基础运行环境。

🔹Java环境：安装JDK 1.8或更高版本，并配置好环境变量，将JDK的bin目录添加到PATH中，以满足Java程序运行需求。

🔹Node.js环境：安装Node.js 12.x或更高版本，确保前端相关功能能够正常运行。

🔹Maven环境：安装Maven 3.x或更高版本，用于项目的构建和管理。

🔹Git：安装Git，以便后续获取项目代码。

3.2 获取源码

🔹版本选择：
建议使用与AllData商业版兼容的OpenMetaData版本。
在这里插入图片描述

3.3 编译构建

🔹进入项目目录：
假设已经通过Git克隆或解压完成，进入项目根目录。

🔹构建项目：
打开终端或命令提示符，切换到项目目录，运行命令mvn clean install进行项目构建。这一步会下载所有依赖项并构建项目，构建成功后通常会在特定模块下生成可执行的WAR文件或通过Spring Boot直接运行的应用。

3.4 部署及运行配置

🔹配置项目：
在项目根目录下，找到application.properties文件，根据实际环境配置数据库连接（如spring.datasource.url、spring.datasource.username和spring.datasource.password）、日志路径等参数。

🔹启动项目：
如果是Spring Boot应用，可使用命令./mvnw spring-boot:run启动项目；对于打包后的应用，可使用命令java -jar target/your-app-name.jar启动。具体启动命令需参考项目中的README.md文件。

🔹访问项目：
项目启动后，可通过浏览器访问OpenMetaData的Web界面，默认情况下访问地址可能为http://localhost:8080（具体地址以实际配置为准）。

3.5 可选配置

🔹日志配置：
在logback.xml文件中，可根据实际需求配置日志输出路径和级别，以便更好地进行日志管理和问题排查。

🔹其他参数配置：
根据项目文档和实际需求，配置其他必要的参数，如数据源连接池大小、缓存配置等，以优化系统性能。

在这里插入图片描述
4.1 元数据资产
支持集中存储与管理多源元数据，提供数据发现、血缘追踪等，助力企业高效管理数据资产。

4.2 数据库表字段-三层数据目录展示
在这里插入图片描述

4.3 元数据洞察
对元数据进行深度分析，挖掘数据关联与价值，助力企业优化数据治理策略，提升数据资产利用率。
在这里插入图片描述

4.4 添加KPI
在这里插入图片描述

4.5 添加元数据工作区
在这里插入图片描述

4.6 添加术语库
在这里插入图片描述

4.7 元数据系统
集中存储与管理多源元数据，提供数据发现、血缘追踪、质量监控等，助力高效数据治理。
在这里插入图片描述

4.8 添加分类
在这里插入图片描述

4.9 添加标签
在这里插入图片描述

4.10 元数据拾取数据血缘
可自动采集并展示数据来源、加工过程及流向，清晰呈现数据血缘关系，助力用户快速定位问题、理解数据链路。
在这里插入图片描述

4.11 数据库拾取数据血缘
在这里插入图片描述

4.12 消息队列拾取数据血缘
支持kafka、Kinesis、Redpanda等消息队列：
在这里插入图片描述

4.13 BI报表拾取数据血缘
在这里插入图片描述

4.14 工作流拾取数据血缘
支持airflow
在这里插入图片描述

4.15 机器学习模型拾取数据血缘
支持mlflow, sagemaker
在这里插入图片描述

4.16 大数据分布式文件存储拾取数据血缘
支持s3，GC3
在这里插入图片描述

4.17 搜索引擎拾取数据血缘
支持elasticsearch
在这里插入图片描述

4.18 第三方元数据软件拾取数据血缘
支持AlationSink, Amundsen, Altas
在这里插入图片描述

4.19 API拾取数据血缘
支持获得http数据血缘
在这里插入图片描述

4.20 团队和用户管理
支持对团队和用户进行权限划分与角色配置，实现细粒度的访问控制，保障元数据安全，助力企业高效协作。
在这里插入图片描述