1、SerDe is a short name for “Serializer and Deserializer.”
Hive uses SerDe (and !FileFormat) to read and write table rows.
HDFS files –> InputFileFormat –> <key, value> –> Deserializer –> Row object
Row object –> Serializer –> <key, value> –> OutputFileFormat –> HDFS files
2、InputFormat是将数据读取进来,解析成一个个记录,SerDe通过Deserializer将记录解析成字段
3、SerDe通过Serializer将字段解析成一个个记录,再通过OutputFileFormat将记录写到存储系统
Hive中的InputFormat、OutputFormat与SerDe
最新推荐文章于 2022-12-11 16:43:34 发布
本文深入探讨了Hive中SerDe(Serializer和Deserializer)及FileFormat的作用与工作原理。介绍了SerDe如何通过Deserializer将HDFS文件转换为Row对象,以及Serializer如何将Row对象转换回<key,value>格式进行存储。同时,阐述了InputFormat在数据读取中的作用。
5万+

被折叠的 条评论
为什么被折叠?



