
数据仓库
文章平均质量分 89
无语梦醒
所有打不死我的,终将使我变得更强
展开
-
DolphinScheduler3.0.1(数据质量)
一开始我在数据质量的模块里找了半天如何创建监控任务,直到我在工作类型中看到DATA_QUALITY,我……核心配置项如下,不同的监控规则可以在数据质量的规则管理界面查看。原创 2023-03-15 11:47:41 · 3673 阅读 · 11 评论 -
DolphinScheduler流程调度工具
目录一、平台简介二、竞品软件分析三、安装部署 3.1 基础环境3.2 安装前操作3.3具体安装操作步骤3.4 名词解释四.功能介绍4.1 首页&项目管理4.1.1 首页4.1.2 项目管理4.1.3 任务节点类型和参数设置4.2 资源中心4.2.1文件管理4.2.2 UDF管理4.3 数据源中心4.4 监控中心4.5 安全中心4.5.1 租户管理4.5.2 用户管理4.5.3 告警组管理4.5.4 Wor.转载 2022-03-16 11:57:01 · 7843 阅读 · 2 评论 -
Datart使用说明
跑象团队新发布的开源平台 Datart安装问题记录原创 2021-10-26 09:27:13 · 6859 阅读 · 2 评论 -
Davinci使用说明
Davinci使用说明文档背景Refer功能详解用户能力用户注册用户权限组织能力编辑项目信息编辑成员信息编辑角色信息编辑组织信息编辑用户能力基础使用顺序数据源-SourceJDBCCSV数据视图-View编辑变量可视化组件-Widget数据配置可视化样式其他配置组件配置仪表板-Dashboard分享联动控制器大屏-Display定时任务-Schedule背景针对目前Davinci的基础能力进行归纳和整理,针对过往的能力不支持部分进行整理满足,此外参考用户手册进行文档整理。建议先仔细研读官方用户手册而后原创 2021-10-09 11:35:39 · 6136 阅读 · 9 评论 -
windows配置Spark连接远程集群
Windows配置Spark连接远程集群本地Spark环境python findsparkSpark代码配置本地Spark环境在使用Spark连接远程集群的过程中要依赖本地的Spark环境,也就是在Windows本地需要有Spark,我这里使用的是2.4的windows spark,如果使用的是CDH配置的Hive集群,那么记得要选择CDH可关联使用的Spark版本由于需要连接到集群上的Spark环境,我们需要本地拥有线上的hdfs-site.xml放在本地的Spark目录中的conf文件夹中,CD原创 2021-10-08 18:21:56 · 1458 阅读 · 0 评论 -
数据仓库面试题整理(一)
面试题整理数据仓库基础范式建模和维度建模主题域划分数据仓库分层优点事实表分类缓慢变化维数据输出SLAHive基础Hive Join类型Hive Map和Reduce个数常见Hive SQL面试题连续登陆N日留存共同好友数据仓库基础范式建模和维度建模1.范式建模2.维度建模主题域划分1.主题域和业务过程2.主题域和主题数据仓库分层优点数仓分层优点:1.解耦数据开发过程,专人专事,降低出问题的风险的同时方便问题定位。2.用空间换时间,用多人多步操作换取使用数据的高效性。3.数据流向规范,原创 2021-07-25 14:19:02 · 2155 阅读 · 2 评论 -
数据仓库知识整理(一)
1.背景 归纳整理数据仓库的基础知识,了解数据仓库的全貌和可深入学习的部分。其中部分话术来源于网络,会在统一位置进行标注引用,感谢大家在网络上的分享!2.数据仓库知识整理2.1 文章引用 2.2 数仓建设必要性 数据仓库的建设自下而上是为了解决BI等技术人员更方便快捷的获取数据,自上而下是为了帮助决策人员更好地了解业务进度、成果,并制定策略。2.3名词解析及图例2.4...原创 2021-05-31 21:19:50 · 622 阅读 · 0 评论 -
数据仓库知识整理(三)
1.背景 归纳整理数据仓库的基础知识,了解数据仓库的全貌和可深入学习的部分,本章节会主要梳理Hadoop&Hive&Spark,末尾链接会梳理离线/实时数仓部分技术能力(持续更新,如果我坚持下去了的话,哈哈哈)。其中部分话术来源于网络,会在统一位置进行标注引用,感谢大家在网络上的分享!2.数据仓库知识整理2.1 文章引用2.2 Hadoop2.3Hive2.4Spark...原创 2021-06-08 16:01:28 · 532 阅读 · 0 评论