1:环境准备(可以是虚拟机)
1:准备虚拟机一台,我安装的是redhat6.4的32位操作系统。
2 :修改hostname。使用命令hostname localhost(如需重启后生效,可以 修改配置文件/etc/sysconfig/network中的HOSTNAME=localhost即可)。另修改/etc/hosts ,用#注释掉默认的文本,添加127.0.0.1 localhost即可。
3:jdk安装(大家可根据操作系统的版本安装相应的JDK,建议1.6以上版本),我的虚拟机是32位的,可下载jdk-6u43-linux-i586.bin文件,上传到/home/software目录下,用命令chmod 755 jdk-6u43-linux-i586.bin授可执行权限。然后./jdk-6u43-linux-i586.bin执行即可快速安装,默认路径在/home/software/jdk1.6.0_43目录中。
4:配置JAVA_HOME。在/etc/profile文件中添加
export JAVA_HOME=/home/software/jdk1.6.0_43
export PATH = $PATH:$JAVA_HOME/bin
保存后用命令source /etc/profile使环境配置修改生效。
用命令java、javac、java -version测试jdk是否成功。
二 :解压spark安装包
三 :测试运行
scala> val textFile = sc.textFile("README.md")
textFile: spark.RDD[String] = spark.MappedRDD@2ee9b6XXX
scala> textFile.count() // Number of items in this RDD
res0: Long = 127
1: spark的默认端口是4040,web界面通过http://localhost:4040访问
三 :总结