
ETL
lbship
工科专业转行大数据分析
展开
-
kettel7连接SQL server2014
一、kettel配置1.导包a.导入Hadoop和hive的jar包把hive相关的jar包放到kettel安装目录的E:\kettle\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\hdp25\lib把Hadoop相关的jar包放到E:\kettle\data-integration\...原创 2018-11-19 16:04:53 · 575 阅读 · 0 评论 -
Sqoop1.99 从SQL Server导数据到HDFS
一、创建link1.创建mssql 的link 启动sqoop2-shell设置端口 set server --host master --port 12000 --webapp sqoop创建连接 create link -c generic-jdbc-connectorName: mssqlJDBC Driver Class: com.microsoft.sqlserv...原创 2018-11-12 17:03:04 · 595 阅读 · 0 评论 -
Hive使用python编写的自定义函数UDF进行ETL
Hadoop使用Streaming技术来替代Java编程,允许用户使用其他语言实现业务逻辑处理Streaming采用UNIX标准输入输出机制(stdin/stdout)作为应用程序和Hadoop计算框架之间的数据接口标准只要符合标准I/O接口,开发人员便可以选择任意语言编写Map/Reduce模块 下面来做个测试:表里一共有两列数据,当第二列的sex...原创 2019-04-11 10:44:20 · 3022 阅读 · 0 评论