数据血缘参考资料文章汇总

mizuhokaga

已于 2024-04-24 13:39:11 修改

阅读量449

点赞数 1

分类专栏：数据血缘文章标签：自言自语

于 2023-07-05 08:49:05 首次发布

本文为博主原创文章，转载请显著位置标明出处，未经博主允许不得用于商业目的。

本文链接：https://blog.youkuaiyun.com/qq_44831907/article/details/131547628

版权

数据血缘专栏收录该内容

10 篇文章

订阅专栏

文章探讨了不同公司如字节跳动、满帮、饿了么和携程在数据血缘追踪和元数据管理方面的实践。提到了HiveSQL的解析和血缘关系建立，以及使用AST的思路。还讨论了数据治理中的血缘分析系统设计，并介绍了基于antlr、jsqlparser等工具解析SQL获取数据血缘的方法。此外，也涵盖了SparkSQL的解析和优化流程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

字节跳动内部的数据血缘用例与设计
全链路数据血缘在满帮的实践
饿了么元数据管理实践之路
携程数据血缘构建及应用
https://www.jianshu.com/p/6a14c846e331
Hive SQL血缘关系解析与应用虽然没有公布完整代码，但是给了我解析ast的思路
Hive SQL的编译过程_美团技术团队
大数据血缘分析系统设计（一） - CXY的大数据实践田简单使用hive自带的钩子函数获取血缘
使用Hive内置的解析器构建血缘关系
数据治理篇-元数据-血缘分析: queryparser概述
系列：用python+antlr解析hive sql获得数据血缘关系（一）
Hive SQL底层执行过程详细剖析
PRESTO SQL输入表、输入字段、LIMIT、JOIN操作解析
Hive使用Calcite CBO优化流程及SQL优化实战
https://github.com/Xiwu1994/sql-parser
https://github.com/scxwhite/parseX/blob/0aed27a5345fbcd180ed3e502cd514829a5560e7/parsex-core/src/main/java/com/sucx/core/HiveSQLParse.java#L19
https://github.com/smallbaby/hql-parser/blob/master/SqlExplainByDruid.java
基于jsqlparser 进行sql语句解析，得到字段间的血缘关系
基于antlr4实现hiveSQL的解析[表血缘和字段血缘]
基于Hql的表级数据血缘
Spark SQL源码剖析（一）SQL解析框架Catalyst流程概述
详解Spark SQL 底层实现原理(parser、analyzer、optimizer、physical plan)
antlr4 + spark sql对业务sql进行解析
Spark SQL源码剖析之SqlParser解析
Spark SQL解析过程以及Antlr4入门
Spark-SQL解析
Spark SQL表达式解析器-Scala Parser与Antlr4
SQL language reference
https://sqlflow.gudusoft.com/#/ sqlfow,国内译名马哈鱼,是最终的研究对象,也是目标效果
https://docs.jsplumbtoolkit.com/community/6.x/ jsplumb 文档

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。