获得技术资料内容,请访问Greenplum中文社区网站
在10月26日下午举办的北京大数据专场活动中,Pivotal 中国研发中心研发工程师邱培峰为大家带来了《GPKafka - Kafka流数据导入工具》的演讲。
Kafka是分布式消息订阅系统,有非常好的横向扩展性,可实时存储海量数据,是流数据处理中间件的事实标准。当通过Kafka和greenplum搭建流处理管道时,如何高速可靠的完成流数据加载,成为用户最关心的问题。从Greenplum 5.10开始,Greenplum发布了新的工具GPKafka,为Greenplum提供了流数据加载的能力。本次分享主要介绍如何使用GPKafka各种特性,用户可以轻易实现实时数据导入,以及断点续传,各种数据格式加载,以及transform等功能。
分享PPT