
大数据
he-yin
这个作者很懒,什么都没留下…
展开
-
Spark使用yarn cluster模式启动,查看打印结果
首先要保证haodoop的日志服务已经开启执行jps能够看到jobhistoryserver才可以。然后提交spark任务执行完成后,在yarn的页面点金这里的logs进入就能看到打印结果了。hadoop的日志服务和spark日志服务如何开启不在本文范围内...原创 2021-10-27 10:54:20 · 1799 阅读 · 0 评论 -
datax配置支持vertica
进入rdbmsreader对应目录,如下所示:在rdbmsreader插件目录下有plugin.json配置文件,在此文件中注册vertica的数据库驱动{ "name": "rdbmsreader", "class": "com.alibaba.datax.plugin.reader.rdbmsreader.RdbmsReader", "description": "useScene: prod. mechanism: Jdbc connection using the da原创 2020-06-16 09:45:29 · 1130 阅读 · 0 评论 -
datax使用小记
DataXDataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、DRDS 等各种异构数据源之间高效的数据同步功能。详细介绍见 https://github.com/alibaba/DataX/blob/master/introduction.md ,本文不对DataX的基本情况进行介绍,主要记录几个注意事项应用本次原创 2020-05-25 14:58:13 · 2687 阅读 · 0 评论