
大数据
ysk_xh_521
这个作者很懒,什么都没留下…
展开
-
大数据之Hadoop家族产品的一个了解。
Apache Hadoop: 是Apache开源组织的一个分布式计算开源框架,提供了一个分布式文件系统子项目(HDFS)和支持MapReduce分布式计算的软件架构。 Apache Pig: 是一个基于Hadoop的大规模数据分析工具,它提供的SQL-LIKE语言叫Pig Latin,该语言的编译器会把类SQL的数据分析请求转换为一系列经过优化处理的MapReduce运算。 Ap原创 2017-08-29 20:05:33 · 6388 阅读 · 0 评论 -
Hadoop各个版本的下载地址
http://mirror.bit.edu.cn/apache/hadoop/common/原创 2017-08-30 10:24:49 · 10663 阅读 · 0 评论 -
linux安装hadoop小结
首先安装jdk设置环境变量下载hadoop修改profile,增加HADOOP_HOME修改hadoop下的4个文件hadoop-env.sh export JAVA_HOME=../../../../home/briup/jdk1.7core-site.xml<property> <name>hadoop.tmp.dir</name> <value>/hadoop<原创 2017-08-30 14:03:13 · 5108 阅读 · 0 评论 -
编写第一个Spark程序WordCount
这里使用IDEA创建项目,其次,在setting-plugins中查找并安装插件Scala开始创建项目 配置sbtname := "spark01"version := "1.0"scalaVersion := "2.11.7"libraryDependencies ++= Seq( "org.apache.spark" %% "spark-core" % "2.0.2")编写代码原创 2017-08-30 20:02:15 · 4920 阅读 · 0 评论 -
spark 启动命令
启动master./sbin/start-master.sh启动worker./bin/spark-class org.apache.spark.deploy.worker.Worker spark://briup-virtual-machine:7077 提交作业./bin/spark-submit --master spark://briup-virtual-machine:7077原创 2017-09-01 09:21:57 · 10256 阅读 · 0 评论