1、 /etc/hosts 里面的各主机ip配置 要和所关联机器系统ifconfig ip地址对应
2、系统 最好用静态ip地址
3、部署启动/访问集群的时候要注意防火墙是否关闭
4、/opt/hive/bin/hive --service hiveserver -p 1043 --hiveconf javax.jdo.option.ConnectionURL=jdbc:mysql://hd194:3306/dp_meta
(hive --service hiveserver为启动hive服务 hive为启动命令行) 修改hive属性的值
5、一台服务器可以开启多个hive 只要 -p 端口号不同
6、用eclipse编写mapreduce程序时,可以先在本地测试,input文件、out文件夹可以用本地的路径作为参数。如果在windows下的eclipse编写需要计算机名为hadoop不然会报权限不足的错误。
7、在经验不足的情况下编写mapreduce可以先用一个可以跑通的mapreduce程序(例如wordcount.java)再在其上面进行拓展。
8、可以把hbase的数据直接动态插入到hive只需在创建hive表时指向hive的数据来源
9、hadoop运行jar 打包为Runnable JAR file :hadoop jar /usr/hadoop20140111/mywordcount1.jar hdfs://hadoop2/test/hadoop/wordcount hdfs://hadoop2/test/hadoop/0003
/usr/hadoop20140111/mywordcount1.jar为本地路径。
10、hadoop运行jar 打包为JAR file:hadoop jar /usr/hadoop20140111/fix.jar WordCount hdfs://hadoop2/test/hadoop/wordcount hdfs://hadoop2/test/hadoop/00048