
spark
文章平均质量分 78
Hikigaya-Hachiman
这个作者很懒,什么都没留下…
展开
-
运行sparksubmit出现java.lang.NoClassDefFoundError: scala/collection/GenTraversableOnce$class
当我运行sparksubmit提交任务的时候报了这个scala/collection/GenTraversableOnce$class的错误.后来进行网上查看说是依赖包中存在与scala版本不匹配的依赖包然后我去maven当中查看,确实是有一个依赖的版本不一样<dependency> <groupId>org.apache.spark</groupId>...原创 2018-03-07 10:44:11 · 6233 阅读 · 0 评论 -
关于maven中的<scope></scope>
maven中的<scope>provided</scope>是为了解决冲突的.因此如果某个依赖加了scope的话,在打包的时候这个依赖就不会打进jar包中.原创 2018-03-07 11:00:56 · 1410 阅读 · 0 评论 -
hbase的认证
现在很多的公司都开始使用了kerberos认证,进行权限控制.下面我就说说hbase的kerberos认证.def putLogsToHTable(p: Iterator[(HBaseKey,String)],bp:Broadcast[Properties]):Unit = { val (ugi,hBaseConf): (UserGroupInformation,Configuration) ...原创 2018-03-07 11:36:08 · 2564 阅读 · 0 评论 -
提交spark的代码的时候出现Exception in thread "main" org.apache.SparkException:Yarn application has already end
出现的具体错误是:Exception in thread "main" org.apache.SparkException:Yarn application has already ended! It might have been killed or unable to launch application master.我最开始运行的是client模式出现了Spark的任务无法提交的情况.之后...原创 2018-03-06 17:08:32 · 7276 阅读 · 0 评论 -
Spark 2.0 DataFrame mapPartitions操作中Unable to find encoder for type stored in a Dataset.问题的分析与解决
在项目开发的过程中,遇到了一个dataframe.mapPartitions操作的时候,出现上述的错误,看了提醒的问题,主要是:需要一个encode操作.但是为了简化操作可以直接将dataframe转换成rdddataframe.rdd.mapPartitions...原创 2018-03-21 09:49:32 · 2517 阅读 · 1 评论