編写Spark应用程序
使用SCALA IDE,新建一个SCALA PROJECT,在项目下新建一个lib的文件夹,把spark的JAR包放进去,并且build path里添加一下JAR包引用,然后添加一个SCALA类SparkRowCount,这个Spark应用程序的功能是计算数据的总行数,代码如下
import org.apache.spark.SparkConf;
import org.apache.spark.SparkContext;
object SparkRowCount {
def main(args: Array[String]) {
if (args.length < 1) {
println("Usage: please specify the file path");
System.exit(1);
}
val conf = new SparkConf().setAppName("row count");