浅尝阿里云的大数据产品--MaxCompute

本文介绍了阿里云大数据计算服务MaxCompute(原ODPS),它是一种TB/PB级数据仓库解决方案。通过项目管理、数据集成和数据开发三个步骤,展示了如何在MaxCompute上建立数据流程,包括数据源添加、数据同步和SQL处理。MaxCompute提供类似Hadoop的云服务,简化了大数据处理,尤其适合已使用Hive的用户。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

简介

先丢一段阿里云官方的说明:

大数据计算服务(MaxCompute,原名ODPS)是一种快速、完全托管的TB/PB级数据仓库解决方案。MaxCompute向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决用户海量数据计算问题,有效降低企业成本,并保障数据安全。

说白了就是阿里云开发了一套大数据平台,相当于hadoop(含数仓工具Hive、工作流引擎Oozie等一套组件)的云版本。如果你有Hive的操作经验,应该会比较容易上手。

上手

一、项目管理-建立项目

这里项目的概念有点像数据流转流程中的层级,按照一般做法会有ods层、dw层、bi层。当然也可以更细,dw层拆分成original、cleaning、finish三层结构。关键还是看需求,看数据清洗、数据处理的过程是否复杂到需要建立多层结构。

二、数据集成-添加数据源

其实一开始DataWorks就为我们默认建立了一个叫做odps_first的数据源,代表的是这个odps项目本身。在ods项目中添加所有源数据库。支持的数据库种类相当丰富,丢图跑:
这里写图片描述
添加的数据库支持阿里云、本地有公网IP、本地无公网IP,

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值