
Hadoop
mulangren1988
开朗乐观,积极上进
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
HIVE外部表和管理表区别以及INSERT INTO/INSERT OVERWRITE区别
很多同学在Hive开发过程中,都会遇到外部表和管理表的问题,而且在联合使用insert into 和 insert overwrite 时,总是理不清。下面我们就根据实际开发中的测试来说明一下。Hive中管理表与外部表的区别:1、在导入数据到外部表,数据并没有移动到自己的数据仓库目录下,也就是说外部表中的数据并不是由它自己来管理的!而管理表则不一样; 2、在删除管理表的时候,Hive将会把属于表原创 2017-01-05 15:24:24 · 8339 阅读 · 0 评论 -
hive weekofyear 怪异的姿势
hive weekofyear : Error: java.lang.RuntimeException: org.apache.hadoop.hive.ql.metadata.HiveException: Hive Runtime Error while processing row原创 2017-07-19 19:58:56 · 1294 阅读 · 0 评论 -
org.apache.hadoop.mapreduce.task.reduce.Shuffle error in shuffle in fetcher
org.apache.hadoop.mapreduce.task.reduce.Shuffle error in shuffle in fetcher 分析及方案原创 2017-07-19 14:11:29 · 6217 阅读 · 1 评论 -
hive mapreduce reducer 调优
hive mapreduce reducer 调优原创 2017-07-20 09:52:11 · 1158 阅读 · 0 评论 -
hadoop hive 分区表load至新表
hadoop hive 分区表load至新表原创 2017-04-11 19:37:13 · 3928 阅读 · 0 评论 -
hadoop fs 命令使用
hadoop fs 命令使用原创 2017-02-04 09:43:36 · 27752 阅读 · 0 评论 -
shell 读取文件行
有道笔记-shell 读取文件行 最近通过Spark Streaming消费Kafka数据,消费的数据落到hdfs,一分钟一个小文件,昨天架构那边的同事告诉我要清理历史文件,但是目录太多,手动删比较慢,于是想到可以把文件目录都拿到,写入文本 path_to_clean.txt,通过shell循环读路径,并执行删除。hdfs://nameservice1/user/hadoop/dw_realtim原创 2017-01-10 19:09:26 · 2258 阅读 · 1 评论 -
大数据发展及岗位分析
最近一年大数据火爆异常,各种培训班开课广告满天飞,很多做开发的朋友也想转到大数据这一行,在投递简历的时候进场被几个岗位搞迷糊,他们是大数据分析师,大数据研发工程师,大数据建模工程师,大数据挖掘工程师。我会根据前同事所在公司的相应岗位,列出岗位职责和要求,供大家借鉴。原创 2017-01-20 23:50:35 · 5171 阅读 · 2 评论 -
大数据开发工程师岗位分析
最近一年大数据火爆异常,各种培训班开课广告满天飞,很多做开发的朋友也想转到大数据这一行,在投递简历的时候进场被几个岗位搞迷糊,他们是大数据分析师,大数据研发工程师,大数据建模工程师,大数据挖掘工程师。我会根据前同事所在公司的相应岗位,列出岗位职责和要求,供大家借鉴。原创 2017-01-20 23:37:06 · 30671 阅读 · 2 评论 -
ZooKeeper 学习之logback配置文件
ZooKeeper 学习之logback配置-这是一个读写zk的学习项目,用到了zookeeper、logback、slf4j、maven等工具原创 2017-02-18 19:47:05 · 4904 阅读 · 0 评论 -
Linux 下换行符转换
Linux和Windows和换行符不一样。Windows下是CRLF(\r\n或0d0a),Linux下是LF(\n或0a)。在Linux下有时会遇到从Windows过来的文本文件,这些文件带了Windows换行符,Linux下进行脚本处理时有可能会出一些莫名其妙的错误。因此需要将这些文件转换为Linux换行符。之前都是用dos2unix命令转换,但是很多系统没装这个命令。Linux自带的sed命令原创 2017-01-10 19:10:17 · 30960 阅读 · 1 评论 -
hadoop|hdfs 基本操作-增删查
hdfs 增删查等基本操作## 查看hadoop fs -ls /user/hadoop/dw_realtime/config/## 删除文件hadoop fs -rm /user/hadoop/dw_realtime/config/id.properties## 删除目录及文件hadoop fs -rmr /user/hadoop/dw_realtime/config/## 创建目录had原创 2017-01-13 18:43:55 · 1831 阅读 · 0 评论 -
Hive UDF 手册
官方 HiveUDF LanguageManual 点这里关系运算等值比较: = 语法:A = B 操作类型: 所有基本类型 描述: 如果表达式A与表达式B相等,则为TRUE;否则为FALSE 举例:hive> select 1 from dual where 1=1;1##### 不等值比较: <>语法: A <> B 操作类型: 所有基本类型描述: 如果表达式A为NULL,或者翻译 2017-01-06 10:05:57 · 1373 阅读 · 0 评论 -
Hive 正则提取英文名称和中文名称
Hive 正则提取英文名称和中文名称提取英文名称select regexp_extract("Aptamil 爱他美(德国)",'([A-Z][a-z]*(\\s|$))+', 1);select regexp_extract("Skin 伊思",'(\\w*(\\s|$))+', 1);select regexp_extract("SKIN 伊思",'(\\w*(\\s|$))+',..原创 2018-11-12 16:51:30 · 9457 阅读 · 6 评论