hadoop
·慕晴·
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Hive中的map类型及其操作
–创建表,并定义map类型create table employee(id string, perf map<string, string>) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' COLLECTION ITEMS TERMINATED BY ',' --map形式key:value,原创 2020-06-29 15:22:27 · 23014 阅读 · 0 评论 -
HIVE中用了 NOT IN的问题
两表通过id匹配,求 A-B ,用 NOT IN 实现select * from a where id not in ( select id from b );OKTime taken: 34.123 seconds, Fetched: 0 row(s)这里有诡异了,为什么结果集没了呢? 不能啊??原因:在RMDB中, t1.id IN (select t2.id from b t2 ) 等价于 : t1 join b t2 on t1.id = t2.id and t1.id is not n转载 2020-06-05 16:03:48 · 1256 阅读 · 0 评论 -
hive正则表达式匹配中文或者字符
hive正则表达式匹配中文或者字符regexp_replace()regexp_extract()regexp_replace()案例1:select regexp_replace('四川成都市A-17号','[^A-Za-z0-9\\u4e00-\\u9fa5]','');结果:四川成都市A17号解释:替换非字符(大小写),非数字和非中文的字符。regexp_extract()案例2:select regexp_extract('四川成都市A-17号','[^A-Za-z0-9\\u4原创 2020-05-19 15:42:22 · 12297 阅读 · 0 评论 -
hadoop2.6+hive+oozie+sqoop+hue集群搭建
hadoop集群搭建一、 环境说明二、 环境搭建1. Linux系统准备2. 安装jdk8并设置环境变量3. 安装mysql4. 安装hadoop5. 安装hive6. 安装sqoop7. 安装oozie8. 安装hue9. 结果展示10. 启动集群脚本一、 环境说明我使用的是笔记本电脑,一台8G内存,一台4G内存,然后在笔记本上搭建虚拟机centos7.0当作搭建hadoop的机器,最终的结...原创 2020-01-20 18:05:01 · 1487 阅读 · 0 评论 -
在hue上使用oozie的时候报错java.lang.StackOverflowError
在hue上使用oozie的时候报错java.lang.StackOverflowError原因产生:问题的解决说明:自己搭建了一个大数据平台,但是在使用的时候报这个错误,这个可以给遇到此错误的人一个解决方法(我搭建的是CDH5.6.0的一套,后续我还会把我搭建的环境的整个步骤写成文档)。**原因产生:**网上说产生这个错误的原因2:1)启动MainActivity,会创建一个线程,同时...原创 2020-01-19 12:31:01 · 432 阅读 · 0 评论 -
hadoop相关学习博客
在此记录有助于方便学习!hadoop:https://www.cnblogs.com/wangsongbai/category/1226969.html学习hive博客地址:https://www.cnblogs.com/wangsongbai/tag/hive/https://www.cnblogs.com/wangsongbai/category/1226985.htmlstorm...原创 2019-04-24 08:58:56 · 209 阅读 · 0 评论 -
windows下安装hadoop2.6和spark2.3.3需要的安装包
1.hadoop2.6.52.spark2.3.3-2.63.java8原创 2019-07-10 23:06:24 · 573 阅读 · 0 评论 -
java写mr程序1-worldCount
1.计数MapReducemapper程序:package cn.mr;import java.io.IOException;import org.apache.hadoop.io.LongWritable;import org.apache.hadoop.io.Text;import org.apache.hadoop.mapreduce.Mapper;import org.ap...原创 2019-07-23 23:26:35 · 733 阅读 · 0 评论 -
java写mr程序2-flowSum
2.mapreduce程序统计上行下行流量①FlowBean类:package cn.mr.flowSum;import java.io.DataInput;import java.io.DataOutput;import java.io.IOException;import org.apache.hadoop.io.Writable;import org.apache.hado...原创 2019-07-23 23:50:25 · 504 阅读 · 0 评论
分享