Spark的Dataframe(Dataset)转Json字符串
Spark的Dataframe(Dataset)转Json,网上很多都说的太麻烦了,让你先转换成collect,然后按照不同的filed字段去转义。
完全不用那么麻烦
原理就是先把Dataset<row>就是Dataframe对象(带schema的数据类型)转换成一行一行的String类型数据
Dataset<String> stringDataset = Dataset<Row> rowDataset.toJSON();
这个时候调用stringDataset的show方法,你可以看到你的数据如下:
+-----------------------------------------------------------------+ | value| +--------------------+ |{"taskConfigId":"123", "xxx": 123, "date": "2018-11-28 00:12:21"}| |{"taskConfigId":"321", "xxx": 123, "date": "2018-11-28 00:12:21"}| |{"taskConfigId":"qwe", "xxx": 123, "date": "2018-11-28 00:12:21"}| |{"taskConfigId":"34", "xxx": 123, "date": "2018-11-28 00:12:21"}| |{"taskConfigId":"341", "xxx": 123, "date": "2018-11-28 00:12:21"}| +------------------------------------------------------------------+
就相当于你的