举例: 比如我们有几百个文件,那么会有几百个map,读取之后做join操作效率会非常低,我们可以使用coalesce()合并分区,减少分区数,再去shuffle,产生的文件数会小很多,提高了join效率。