scala&spark相关

  1. scalatest 版本要和scala版本一致。
  2. scalac error : bad option: ‘-make:transitive’
在pom.xml中,删除-make:transitive
  1. 一般而言,saveAsTextFile会按照执行task的多少生成多少个文件,比如part-00一直到part-0n,n自然就是task的个数,亦即是最后的stage的分区数。
//做完计算之后将数据汇集到一个分区,然后再执行保存的动作
coalesce(1,true).saveAsTextFile()
//或
repartition(1)
  1. HDFS上读取文件&本地文件系统读取
    spark默认是从hdfs读取文件的。
//从HDFS中读取文件
sc.textFile("hdfs://")
//从本地文件系统中读取文件
sc.textFile("file://")
  1. Spark-submit class not found exception & Spark Sql 中 com.mysql.jdbc.Driver ClassNotFoundException
val conf = new SparkConf().setJars(List("SparkTagPaper.jar","mysql-connector-java-5.1.35.jar"))

Common Spark Troubleshooting
需要的jar包没有被提交到worker上,通过setJars手动将jar包加入要提交的jar list中。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值