1、设置配置
spark.sql("set hive.exec.dynamic.partition=true")
spark.sql("set hive.exec.dynamic.partition.mode=nonstrict")
spark.sql("SET spark.sql.shuffle.partitions=1") //优化,防止生成很多的小文件
2、进行insert into 将tmp里的很多小文件进行合并,合并到test中
def merg
1、设置配置
spark.sql("set hive.exec.dynamic.partition=true")
spark.sql("set hive.exec.dynamic.partition.mode=nonstrict")
spark.sql("SET spark.sql.shuffle.partitions=1") //优化,防止生成很多的小文件
2、进行insert into 将tmp里的很多小文件进行合并,合并到test中
def merg
1200
3270
1922

被折叠的 条评论
为什么被折叠?