- 博客(5)
- 收藏
- 关注
转载 大数据调度DolphonScheduler
大数据,Hadoop,Hive, Sprrk 什么是DolphonScheduler?DolphinScheduler官网,通过官网介绍,我们知道 DolphinScheduler 是一个分布式、 易扩展的可视化 DAG 工作流任务调度平台。致力于解决数据处理流程中错综复杂的依赖关系,使调度系统在数据处理流程中开箱即用。工作流要求:工作流需包含三个 Shell 类型的任务节点,分别是 A, B, C。三个任务的依赖关系如下所示:任务A -> 任务B -> 任务C。
2023-01-09 21:18:41
870
原创 大数据之Zookeeper安装
Zookeeper就其本质,是一个开源的分布式的,为分布式应用提供协调服务的Apache项目。看一眼官网描述,其为高可靠的分布式协调工具,注意是分布式协调,不是分布式存储,因此不用期望在Zookeeper上面可以存储很多数据。
2022-10-25 15:46:49
725
原创 DataX案例分享01(Hive -> ES)
常用ETL组合,DataX数据同步,DataX Hive Reader和 Elasticsearch Write
2022-09-26 15:46:44
1863
原创 vsftp
vsftp一、FTP介绍 * FTP:文件传输协议(file transfer protocol) * 常见的FTP: - Linux : vsftp ProFTPD(daemon 守护进程) - windows : Serv-v二、VSFTP介绍 - vsftp :(very secure FTP) - 特点:安全、高速、稳定 - 端口...
2018-04-25 22:39:53
328
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人