🔥🔥 AllData大数据产品是可定义数据中台,以数据平台为底座,以数据中台为桥梁,以机器学习平台为中层框架,以大模型应用为上游产品,提供全链路数字化解决方案。
✨杭州奥零数据科技官网:http://www.aolingdata.com
✨AllData开源项目:https://github.com/alldatacenter/alldata
✨Gitee组织:https://gitee.com/alldatacenter
摘要:元数据管理平台基于开源项目OpenMetaData建设,能够帮助企业更好地理解和管理数据资产,提升数据质量和价值,支持数据驱动的决策和创新。文章内容主要为以下四部分:
一、在线演示环境
二、功能简介
三、源码编译部署安装
四、访问元数据管理平台页面
💡Tips:关注「公众号」大数据商业驱动引擎
🔹AllData数据中台线上正式环境:http://43.138.156.44:5173/ui_moat/
请联系市场总监获取账号密码
2.1 元数据管理平台基于开源项目OpenMetaData建设
AllData数据中台元数据管理平台OpenMetaData通过全面的元数据采集、强大的存储与检索、深度的分析与治理、灵活的应用与共享、高扩展性与定制化以及直观的用户体验,为企业提供了一站式的元数据管理解决方案。该平台能够帮助企业更好地理解和管理数据资产,提升数据质量和价值,支持数据驱动的决策和创新。
🔹OpenMetaData开源项目:
https://github.com/open-metadata/OpenMetadata
🔹更多教程可以参考官方教程文档:
https://docs.open-metadata.org/latest
2.2 元数据管理平台功能特点:
- 全面的元数据采集与整合
- 强大的元数据存储与检索
- 深度的元数据分析与治理
- 灵活的元数据应用与共享
- 直观的用户体验
💡部署步骤:
3.1 环境准备
🔹操作系统要求:需准备Linux或macOS操作系统,为部署OpenMetaData提供基础运行环境。
🔹Java环境:安装JDK 1.8或更高版本,并配置好环境变量,将JDK的bin目录添加到PATH中,以满足Java程序运行需求。
🔹Node.js环境:安装Node.js 12.x或更高版本,确保前端相关功能能够正常运行。
🔹Maven环境:安装Maven 3.x或更高版本,用于项目的构建和管理。
🔹Git:安装Git,以便后续获取项目代码。
3.2 获取源码
🔹版本选择:
建议使用与AllData商业版兼容的OpenMetaData版本。
3.3 编译构建
🔹进入项目目录:
假设已经通过Git克隆或解压完成,进入项目根目录。
🔹构建项目:
打开终端或命令提示符,切换到项目目录,运行命令mvn clean install进行项目构建。这一步会下载所有依赖项并构建项目,构建成功后通常会在特定模块下生成可执行的WAR文件或通过Spring Boot直接运行的应用。
3.4 部署及运行配置
🔹配置项目:
在项目根目录下,找到application.properties文件,根据实际环境配置数据库连接(如spring.datasource.url、spring.datasource.username和spring.datasource.password)、日志路径等参数。
🔹启动项目:
如果是Spring Boot应用,可使用命令./mvnw spring-boot:run启动项目;对于打包后的应用,可使用命令java -jar target/your-app-name.jar启动。具体启动命令需参考项目中的README.md文件。
🔹访问项目:
项目启动后,可通过浏览器访问OpenMetaData的Web界面,默认情况下访问地址可能为http://localhost:8080(具体地址以实际配置为准)。
3.5 可选配置
🔹日志配置:
在logback.xml文件中,可根据实际需求配置日志输出路径和级别,以便更好地进行日志管理和问题排查。
🔹其他参数配置:
根据项目文档和实际需求,配置其他必要的参数,如数据源连接池大小、缓存配置等,以优化系统性能。
4.1 元数据资产
支持集中存储与管理多源元数据,提供数据发现、血缘追踪等,助力企业高效管理数据资产。
4.2 数据库表字段-三层数据目录展示
4.3 元数据洞察
对元数据进行深度分析,挖掘数据关联与价值,助力企业优化数据治理策略,提升数据资产利用率。
4.4 添加KPI
4.5 添加元数据工作区
4.6 添加术语库
4.7 元数据系统
集中存储与管理多源元数据,提供数据发现、血缘追踪、质量监控等,助力高效数据治理。
4.8 添加分类
4.9 添加标签
4.10 元数据拾取数据血缘
可自动采集并展示数据来源、加工过程及流向,清晰呈现数据血缘关系,助力用户快速定位问题、理解数据链路。
4.11 数据库拾取数据血缘
4.12 消息队列拾取数据血缘
支持kafka、Kinesis、Redpanda等消息队列:
4.13 BI报表拾取数据血缘
4.14 工作流拾取数据血缘
支持airflow
4.15 机器学习模型拾取数据血缘
支持mlflow, sagemaker
4.16 大数据分布式文件存储拾取数据血缘
支持s3,GC3
4.17 搜索引擎拾取数据血缘
支持elasticsearch
4.18 第三方元数据软件拾取数据血缘
支持AlationSink, Amundsen, Altas
4.19 API拾取数据血缘
支持获得http数据血缘
4.20 团队和用户管理
支持对团队和用户进行权限划分与角色配置,实现细粒度的访问控制,保障元数据安全,助力企业高效协作。