
CDH
文章平均质量分 82
夜空骑士
我是一名数据玩家,对数据行业的知识有着极大的学习热情,在数据分析、数据挖掘、大数据、人工智能等多个方面均有所涉猎,致力于将数据技术应用于各个行业领域,不断提升自我、完善自我、充实自我,并与数据爱好者共同分享、共同进步、共同成长!数据之路,前路漫漫,你我同在,互动前行!
展开
-
【CDH】部署Cloudera Management for centos 7
hadoop生态圈框架工具甚多,自己整合起来很是繁琐,特别是oozie以及hue结合来实现hive、mr、spark等定时依赖任务更是一步一个坑,为了减少踩坑,只好从apache hadoop,转向CDH。两个各有利弊,CDH贵在整合方便。本次教程大部分来自http://www.cnblogs.com/fujiangong/p/5620050.html,稍作修改,记录踩下的坑。JDK环境...转载 2018-07-26 11:24:13 · 608 阅读 · 0 评论 -
【Sqoop】从MySQL同步数据到Hive的操作参数解析
参数解析:必选参数--connect :连接的mysql数据库的jdbc信息--username:mysql数据库的登录账户--password:mysql数据库的登录密码--table: 关系数据库表名 --hive-import: 从关系型数据库向hive中导入数据的标志可选参数--as-testfile: 将数据导入一个普通文本文件中--as-sequen...原创 2018-08-16 18:45:13 · 2813 阅读 · 0 评论 -
【Sqoop】Sqoop如何增量抽取数据
实现方法:利用--where参数对关系型数据库数据进行筛选,将结果导入非关系型数据库。根据特殊字段,将日期作为一个查询条件对源数据进行匹配,将符合条件的记录作为结果采集到非关系型数据库中格式:import --connect jdbcurl --username xxxx--password ****** --table tablename --where "data_inse...原创 2018-08-16 18:47:25 · 3817 阅读 · 0 评论