val buffer: mutable.Buffer[Object] = Row.unapplySeq(row).get.map(_.asInstanceOf[Object]).toBuffer
buffer.append(要加的字段)
val schema: StructType = row.schema.add("aaa", StringType).add("bbb", StringType).add("ccc", StringType)
val new_row = new GenericRowWithSchema(buffer.toArray, schema)
spark RDD[Row] 字段太多优化处理
于 2019-12-13 10:21:29 首次发布
本文详细介绍了如何在Spark中使用Scala进行DataFrame的操作,包括如何从现有的Row对象创建新的DataFrame,通过添加字段到mutable.Buffer并更新schema来实现DataFrame的扩展。这对于理解和实践大数据处理中的数据结构调整具有重要意义。

1189

被折叠的 条评论
为什么被折叠?



