
大数据
祁云泠伊
这个作者很懒,什么都没留下…
展开
-
griffin编译安装
Griffin编译安装前言Griffin是一个应用于分布式数据系统中的开源数据质量解决方案,例如在Hadoop, Spark, Storm等分布式系统中,Griffin提供了一整套统一的流程来定义和检测数据集的质量并及时报告问题。Apache Griffin是一个开源的大数据数据质量解决方案,它支持批处理和流模式两种数据质量检测方式,可以从不同维度度量数据资产,从而提升数据的准确度和可信度。例如:离线任务执行完毕后检查源端和目标端的数据数量是否一致,源表的数据空值等一、Griffin介绍起源在eBa原创 2020-12-27 17:50:33 · 887 阅读 · 0 评论 -
ambari-server安装文档
AmbariServer安装文档基础镜像-----sweetfly123/baseubuntu:18.04v2在 /etc/apt/sources.list.d 下面添加ambari.list#VERSION_NUMBER=2.7.3.0-139#json.url = http://public-repo-1.hortonworks.com/HDP/hdp_urlinfo.json...原创 2020-04-27 14:08:06 · 181 阅读 · 0 评论 -
oozie coordinator时区设置
coordinator时间设置与job.properties配置coordinator.xml<coordinator-app name="cron-coord" frequency="${coord:minutes(1)}" start="${start}" end="${end}" timezone="GMT+0800" xmlns="uri:ooz...原创 2019-09-17 16:25:07 · 253 阅读 · 0 评论