
大数据
默-言
嘿嘿嘿
展开
-
m2eclipse安装
网上说的方法全是扯淡,照着来全有版本问题;So,找到eclipse对应版本号,如3.8对应juno,则在help-> install new software->add->http://download.eclipse.org/releases/juno其他版本则修改网址最后的如juno->indigo在下拉列表中依次搜索安装SVN、GEF、m2e即可原创 2016-11-15 22:18:58 · 214 阅读 · 0 评论 -
HiveSQL常见问题总结
1.column repeated in creation: member_id在所有之前的select里,对应字段如果有名字一样的,必须加表名防混淆2.去重(完全重复的行)select distinct * from ( )如果是要删除表中存在的重复记录,那就逻辑处理,如下:select Test from Table group by Test having cou原创 2017-06-01 11:08:45 · 2557 阅读 · 0 评论 -
MapReduce任务参数调优
转载自JavaChen Blog,作者:JavaChen原文链接地址:http://blog.javachen.com/2014/06/24/tuning-in-mapreduce.html本文主要记录Hadoop 2.x版本中MapReduce参数调优,不涉及Yarn的调优。Hadoop的默认配置文件(以cdh5.0.1为例):core-default.xmlhdfs-d转载 2017-04-12 21:01:13 · 352 阅读 · 0 评论 -
hadoop fs shell常用命令列表
调用文件系统(FS)Shell命令应使用 bin/Hadoop fs 的形式。 所有的的FS shell命令使用URI路径作为参数。URI格式是scheme://authority/path。对HDFS文件系统,scheme是hdfs,对本地文件系统,scheme是file。其中scheme和authority参数都是可选的,如果未加指定,就会使用配置中指定的默认scheme。一个HDFS文件或目转载 2017-03-30 16:20:23 · 731 阅读 · 0 评论 -
Streaming框架多输入时报Streaming Command Failed!错误解决
今天写sh脚本的时候居然Streaming Command Failed!原因找了半天,还好有之前正确的对比,原因如下:我定义了两个不同的输入input1,input2,然后在下面这部分hadoop jar $streaming_jar \-D mapreduce.job.queuename=root.default \ -input $input,$input2原创 2017-03-28 18:16:26 · 5231 阅读 · 1 评论 -
hadoop 打印configeration信息到控制台
conf声明后:for (Entry entry: conf) {//Entry 是一个pair类 用getkey() getvalue()方法获取键值对 System.out.printf("%s=%s\n", entry.getKey(), entry.getValue()); }这里的entry需要导入import java原创 2017-03-11 16:02:39 · 452 阅读 · 0 评论 -
hbase配置问题解决
按照这篇文章配置http://www.aboutyun.com/thread-12057-1-1.html两个问题:1.stopping hbasecat: /tmp/hbase-hadoop-master.pid: 没有那个文件或目录方法1由于系统删了临时文件:在/usr/hbase-0.98.24-hadoop2里新建pids文件夹修改/usr/hbase-0.98.24-hado原创 2017-02-13 10:57:41 · 4065 阅读 · 0 评论 -
maven编译报错解决
在项目工作目录的带pom。xml的路径下,运行mvn package1.Description Resource Path Location TypeMissing artifact org.apache.hadoop:hbase-client:jar:0.98.24-hadoop2 pom.xml /example line 50 Ma原创 2017-02-14 10:45:34 · 440 阅读 · 0 评论 -
hadoop编译找不到类解决方法
Mahout算法解析与案例实战P32页的代码编译运行报错,提示找不到类:Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/mahout/common/AbstractJobat java.lang.ClassLoader.defineClass1(Native Method) at java原创 2016-11-18 17:18:20 · 3999 阅读 · 2 评论 -
hadoop下编译运行mahout示例的问题解决方案
对于命令行:$HADOOP_HOME/bin/hadoop jar $MAHOUT_HOME/mahout-examples-0.12.2-job.jar org.apache.mahout.clustering.syntheticcontrol.cannopy.Jobprob1:Retring connect to server:0.0.0.0/0.0.0.0:8030.Already tr原创 2016-11-15 20:59:41 · 578 阅读 · 0 评论 -
Maven环境配置
根据mahout算法解析与案例实战这本书,maven的环境配置p21第4行的代码是有误的正确配置应该是这样:sudo vim ~/.bashrc按f12进插入以下代码从第一行开始写:JAVAHOME=/usr/lib/jvm/jdk1.7.0_79/M2=/home/hadoop/mahout/apache-maven-3.3.9/PATH=$JAVA_HOME/bin:$原创 2016-11-14 16:52:20 · 227 阅读 · 0 评论 -
我的sql逻辑坑汇总
1.任何xx<>'xxxx'等式,考虑补上or xx is null2.源数据生命周期不一致时:方案一:按照最远的那个表来方案二:两套代码拆分得到两套输出方案三:union all整合3.concat函数很蠢,遇空则空,改用bi:concat4.任何一套代码开发完成,回头检验条数和数据一致性。...原创 2018-12-17 15:09:10 · 294 阅读 · 1 评论