
hadoop
文章平均质量分 83
hjh00
这个作者很懒,什么都没留下…
展开
-
Hadoop基准测试HiBench 学习笔记 - 1
一、准备工作操作系统 centOS 64 位JDK 1.7 maven hadoop 2.6github下载HiBench 4.0运行 bin/build-all.sh编译 (参考HiBench 的说明,因没有安装spark,直接运行run-all.sh 会报错,忽略)。二、 编译运行1. conf 目录下的benchmarks.lst文件设置测试项,一行一个测试原创 2015-12-11 11:32:50 · 7585 阅读 · 0 评论 -
Spark SQL 配置
配置好hive后,spark sql 配置就很简单了,实际上只要配置一个hive-site.xml文件,拷贝到spark/conf目录下。这个文件是给spark使用的,hive的配置文件用自己的配置文件。1. 配置hive-site.xml hive.metastore.uris thrift://localhost:9083 Thrift URI for t原创 2017-05-09 19:05:27 · 2340 阅读 · 0 评论 -
HBase 安装
hbase 1.2.0安装配置序号主机名IP安装软件1d-hdp-client192.1.131.199hadoophbase 不运行2d-hdp-01192.1.131.201hadoop namenodezo原创 2017-02-25 00:02:09 · 593 阅读 · 0 评论 -
TensorflowOnSpark 安装
Tensorflow on Spark 安装原创 2017-03-21 13:14:32 · 8358 阅读 · 14 评论 -
Hive 安装 python thrift 连接hiserver2
Hive 安装 python thrift 连接hiserver2原创 2017-03-27 19:51:12 · 2355 阅读 · 0 评论 -
Spark 安装
spark 安装原创 2017-03-05 10:28:21 · 879 阅读 · 0 评论 -
用命令获取hdfs的基本信息 - hdfs getconf 和 hdfs dfsadmin
用hdfs getconf 和 hdfs dfsadmin 可以获得hdfs的基本信息。原创 2016-11-09 12:43:59 · 5559 阅读 · 0 评论 -
hadoop 开发调试环境-eclipse配置记录
一 目标 基于前面安装的hadoop单机伪分布环境安装配置eclipse和eclipse hadoop 插件,并运行wordcount程序检验是否正确。参考了网上的资料。二 配置过程 1. 准备软件 eclipse-jee-juno-SR2-linux-gtk-x86_64.tar.gzhadoop-eclipse-plugin-2.2.0.jar2.安装 1)原创 2016-07-19 19:58:46 · 1869 阅读 · 0 评论 -
hadoop 开发调试环境
一 目标 虚拟机安装ubuntu14.04(64位),然后安装hadoop 2.6.0(伪分布),pig、hive和mahout,用作开发调试。二 安装1. 配置ssh ssh-keygen -t rsacd ~/.sshcat id_dsa.pub >> ~/.ssh/authorized_keys2.软件准备Jdk和mysql-server 直接用apt-g原创 2016-07-18 17:40:24 · 742 阅读 · 0 评论 -
hadoop编程入门学习笔记-5 reduce-side join
用MultipleInputs实现Reduce-side join原创 2015-12-21 09:23:27 · 1191 阅读 · 0 评论 -
hadoop编程入门学习笔记-4 ChainMapper、DistributedCache和Context
ChainMapper、DistributedCache和Context原创 2015-11-17 20:30:19 · 1278 阅读 · 0 评论 -
hadoop编程入门学习笔记-3 开发MapReduce程序
Hadoop Streaming 和 Python原创 2015-07-29 17:21:04 · 1071 阅读 · 0 评论 -
hadoop编程入门学习笔记-2 通过示例程序理解hadoop
一、运行WordCounthdfd和yarn已运行,如果没有运行,用start-dfs.sh和start-yarn.sh运行。1. 创建目录和准备文件$hdfs dfs -mkdir /user$hdfs dfs -mkdir /usr/hadoop$hdfs dfs -ls / $echo "This is a test." >> test.txt$cat test.tx原创 2015-07-10 11:53:50 · 1109 阅读 · 0 评论 -
hadoop编程入门学习笔记-1 安装运行hadoop
hadoop实验环境安装部署原创 2015-07-09 10:01:53 · 966 阅读 · 0 评论 -
Spark streaming 入门实验
Spark Streaming 是一个基于spark的实时计算框架。详细说明参考Spark Streaming Programming Guide. 以下是编程指南WordCount例子的在spark-shell了实验记录。运行前,把spar/conf目录下的log4j.properties里的日志级别由INFO改为WARN,否则或打印太多的日志。1. 运行 nc 模拟数据源输入文中的命令原创 2017-05-11 19:09:59 · 905 阅读 · 0 评论