在用Scala开发Spark中,我们经常使用到DataFrame。但是在Java开发过程中,却发现根本没有DataFrame这个包。
很慌的好不好。赶紧百度,然后再官方文档中发现了一句话
In Scala and Java, a DataFrame is represented by a Dataset of Rows.
In the Scala API, DataFrame is simply a type alias of Dataset[Row].
While, in Java API, users need to use Dataset<Row> to represent a DataFrame.
啥意思呢?就是说根本就没有DataFrame!!一直都是Dataset<Row>,DataFrame就是一个别称、小名!!!