准备研究一下AWS平台对大数据的支持,我之前用的是aliyun的maxcompute,在国内比较好,但是如果要想把业务扩展到国际,阿里云可能没有AWS那么大的优势。
太细节的东西我就懒得写了,只要给大家梳理一下流程思路,细节的东西我会找到相应的文档贴出来。
浏览AWS平台中大数据相关的工具,最终把目光定位在了redshift上面,这是个数据仓库产品,与maxcomponte对比下得出的结果是
| 对标项 | redshift | maxcompute |
|---|---|---|
| 性能 | 赢 | 输 |
| 功能 | 输 | 赢 |
| 界面 | 输 | 赢 |
想用redshift来代替maxcompute中的功能就比了一下强弱,其实说实话它俩对标性不是太强。redshift更多的只是用来做存储,但是maxcompute把存储、计算、运维甚至是ETL都给干了。但是redshift在存储方面做的更优秀。
redshift入门步骤
一、选国际AWS服务,但是要越过那道。。。你懂的
AWS现在也入驻国内了,但是只支持企业去注册,这点比较尴尬,所以个人也只能用国外的服务。另外国外是有2个月的免费使用期限的,国内的啥都没有。说起来还是看阿里云比较亲切。
二、入门文档阅读顺序
https://docs.aws.amazon.com/zh_cn/redshift/latest/gsg/rs-gsg-prereq.html
先按这个文档把活给做

本文探讨了AWS Redshift作为大数据存储的选择,对比了它与阿里云MaxCompute的功能差异。Redshift更适合存储,而MaxCompute则涵盖更多功能。文章介绍了入门Redshift的步骤,包括选择国际AWS服务、阅读入门文档、使用SQL Workbench/J连接Redshift,并分享了在连接过程中遇到的问题及解决办法。作者作为初学者,鼓励读者在掌握基础后快速进入实战。
最低0.47元/天 解锁文章
4933

被折叠的 条评论
为什么被折叠?



