Preface
本文是对Linkedin-Camus的介绍。内容都是从Camus的github中摘取出来的,详细的内容要看其说明和源码
Introduction of Camus
Camus是Linkedin开源的一个从Kafka到HDFS的数据管道,实际上它是一个MapReduce作业
What is Avro
Apache Avro是一个 Data Serialization System,数据序列化系统。
Camus使用了Avro Schema
LinkedIn的Camus是一个开源工具,用于将数据从Kafka高效地迁移到HDFS。它利用MapReduce作业,通过Avro进行数据序列化。Camus的工作流程包括设置、Hadoop阶段(数据拉取和提交)及清理阶段。要使用Camus,需要进行安装、创建自定义Kafka消息解码器和配置,然后作为Hadoop作业运行。
本文是对Linkedin-Camus的介绍。内容都是从Camus的github中摘取出来的,详细的内容要看其说明和源码
Camus是Linkedin开源的一个从Kafka到HDFS的数据管道,实际上它是一个MapReduce作业
Apache Avro是一个 Data Serialization System,数据序列化系统。
Camus使用了Avro Schema
1484
1万+

被折叠的 条评论
为什么被折叠?