可以清楚看到,df.write().jdbc其实最后就是在foreachPartition里进行批量的insert。如果我们是往postgresql库里写的话,copy明显是比批量insert快的,所以写成
foreachPartition{
copy in
}
其实是比直接调用df.write.jdbc要快速的。
可以清楚看到,df.write().jdbc其实最后就是在foreachPartition里进行批量的insert。如果我们是往postgresql库里写的话,copy明显是比批量insert快的,所以写成
foreachPartition{
copy in
}
其实是比直接调用df.write.jdbc要快速的。