MaxCompute及相关组件
目录
MaxCompute及相关组件 1
一.对于MaxCompute的理解 1
- 官方定义 1
- 对MaxCompute理解 1
二. MaxCompute的阿里云相关组件介绍 2 - DataWorks 2
2.DataHub 5
3.Tunnel 6
4.Quick BI 7
三. 新闻舆情分析其他相关组件介绍 7 - 阿里云实时计算平台 7
四. MaxCompute的相关SDK的实现 8 - JAVA SDK 8
- Python SDK 9
五. MaxCompute的一般流程与新闻舆情流程对比 9
一.对于MaxCompute的理解
- 官方定义
(1)是一种快速、完全托管的GB/TB/PB级数据仓库解决方案。MaxCompute为您提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决海量数据计算问题,有效降低企业成本,并保障数据安全。
(2)MaxCompute主要服务于批量结构化数据的存储和计算,可以提供海量数据仓库的解决方案以及针对大数据的分析建模服务。随着社会数据收集手段的不断丰富及完善,越来越多的行业数据被积累下来。数据规模已经增长到了传统软件行业无法承载的海量数据(百GB、TB乃至PB)级别。
2.对MaxCompute理解
(1)数据仓库,类似于Hive,Hbase
(2)对于数据的导入导出,同步数据等功能比较强,也可以对数据做离线 的分析。
(3)可以通过java代码,声明jdbc连接等方式作为远程操作库表,
一般操作直接通过DataWork(Web客户端)通过其SQL命令进
行操作。
二.MaxCompute的阿里云相关组件介绍
1.DataWorks
DataWork相当于MaxComputer的web客户端,可以在上边配置相关数据源(导入导出功能),书写SQL代码,调用相关的UDF函数(SQL函数,也可以自定义),定义业务流程

本文介绍了MaxCompute作为大数据处理的核心组件,包括其数据仓库特性、数据导入导出能力以及与DataWorks、DataHub、Tunnel和Quick BI等阿里云组件的集成。MaxCompute配合DataWorks进行数据开发,DataHub用于实时数据处理,Tunnel提供数据上传下载服务,而Quick BI则用于数据展示。此外,还讨论了MaxCompute在新闻舆情分析中的作用,涉及实时计算平台和数据同步流程。
最低0.47元/天 解锁文章
3524

被折叠的 条评论
为什么被折叠?



