在本地的spark写成并自测通过后,需要打成jar包并提交到集群,下面是几种打包方案
第一种:通过idea的build artifacts
1.先把meta-inf这个文件夹删掉,如果是第一次build,这个文件夹自然是不存在的
2.到build中点击build artifacts, 如果这个按钮是灰的,到project structure中edit,生成的jar包在out下

点击build的下面的build Artifact下的edit

点击edit之后会进入project structure界面
3.先把原来的jar删掉,然后选中新的,然后将依赖包都删掉,只保留output目录

这种打包方式也是对整个工程打包,且不包含依赖jar包,在线上运行时用的spark jar包都用spark/lib包下的
这种方式的优点
1.比maven的编译速度快
2.只需要配置一次,因为是对整个工程打包
3.不包含依赖的第三方jar包
如果新建了一个class文件需要rebuild,上面这些都不用动,只需要在

本文总结了Spark本地工程的三种打包方案,包括Idea的Build Artifacts、Maven的`mvn clean package`以及不包含依赖的Maven打包。详细介绍了每种方式的优缺点,并给出了提交到YARN集群的示例。同时,强调了打包前的注意事项,如删除本地模式、确保输出目录清空等,以及避免类名冲突的问题。
最低0.47元/天 解锁文章
326

被折叠的 条评论
为什么被折叠?



