学习MaxCompute
什么是MaxCompute
托关于阿里云上的EB级数据仓库类似于hive,不需要自己运维。使用它只需要一个谷歌浏览器访问阿里云,可以在浏览器的界面写sql进行数据分析
购买
由于是存储在云端所以使用肯定要收取存储和计算费用,选择按量付费,购买的时候都是0元
开发者版:提供一部分免费。超出的部分会收费,有许多限制
标准版:按量收费
客户端
要操作Maxcompute就要使用客户端
- DataWorks
1.DataWorks开通MaxCompute会默认让开通DataWorks
2.DataWork上集成了调度,数据同步,编写自己的python,sql,shell,上传自己的udf和sparkjar包
3.支持运维任务的查看,授权管理等
4.支持创建项目
5.推荐下使用DataWorks
- 命令行
在github上下载下来,配置ak,项目名称和endpoint就可以连接,里面有tunnel支持数据的上传下载
- idea
在idea下载插件也可以连接,配置conf文件指定ak,项目名称和endpoint,在idea界面就可以开发
更多的可以参考官网:
https://help.aliyun.com/document_detail/27800.html?spm=a2c4g.11186623.6.547.df3c713fWGMJ97