1、SerDe is a short name for “Serializer and Deserializer.”
Hive uses SerDe (and !FileFormat) to read and write table rows.
HDFS files –> InputFileFormat –> <key, value> –> Deserializer –> Row object
Row object –> Serializer –> <key, value> –> OutputFileFormat –> HDFS files
2、InputFormat是将数据读取进来,解析成一个个记录,SerDe通过Deserializer将记录解析成字段
3、SerDe通过Serializer将字段解析成一个个记录,再通过OutputFileFormat将记录写到存储系统
Hive中的InputFormat、OutputFormat与SerDe
最新推荐文章于 2022-11-13 23:07:45 发布