阿里云DataHub使用教程

DataHub服务由阿里云提供,支持流式数据的发布与订阅,适用于移动设备、应用软件、网站服务、传感器等产生的大量流式数据的持续采集、存储与处理。具备高吞吐、实时性、易用性、高可用、动态伸缩与高安全性等优势。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

DataHub服务是阿里云提供的流式数据(Streaming Data)服务,它提供流式数据的发布 (Publish)和订阅 (Subscribe)的功能,让您可以轻松构建基于流式数据的分析和应用。

DataHub服务可以对各种移动设备,应用软件,网站服务,传感器等产生的大量流式数据进行持续不断的采集,存储和处理。用户可以编写应用程序或者使用流计算引擎来处理写入到DataHub的流式数据比如实时web访问日志、应用日志、各种事件等,并产出各种实时的数据处理结果比如实时图表、报警信息、实时统计等

优势点及简介:

高吞吐:最高支持单主题(Topic)每日T级别的数据量写入,每个分片(Shard)支持最高每日百GB级别的写入量。

实时性:通过DataHub服务,您可以实时的收集各种方式生成的数据并进行实时的处理,对您的业务产生快速的响应。

易用性:DataHub服务提供丰富的SDK包,包括C++, JAVA, Pyhon, 等语言。DataHub服务也提供Restful API规范,您可以用自己的方式实现访问接口。

高可用:服务可用性不低于99.999%。规模自动扩展,不影响对外服务;数据持久性不低于99.99999999%。数据自动多重冗余备份

动态伸缩:每个主题(Topic)的数据流吞吐能力可以动态扩展和减少,最高可达到每主题256MB/s的吞吐量。

高安全性:提供企业级多层次安全防护,多用户资源隔离机制;提供多种鉴权和授权机制及白名单、主子账号功能。

课时列表:

课时1:初识DataHub

课时2:通过Connector同步到Odps

课时3:同步数据到OSS

课时4:使用Logstash导入流式数据

课时5:Odps同步任务异常处理

开始学习:阿里云DataHub使用教程

更多精品课程点击:阿里云大学

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值