Amazon Redshift:数据访问与转换的全面解析
1. 访问所有数据
Amazon Redshift支持访问未加载的数据,其计算引擎可利用已有的转换功能处理数据,无需单独的处理服务器。无论数据是“外部Amazon S3数据”、“外部运营数据”还是“外部Amazon Redshift数据”,都可以使用熟悉的ANSI SQL语法在Amazon Redshift数据仓库中提交查询,仅处理适用的数据,并可与本地数据连接,用于填充本地表。
1.1 外部Amazon S3数据
Amazon Redshift允许使用简单的SQL查询读写存储在Amazon S3中的外部数据,这增强了数据的互操作性,因为可以从多个计算平台(如Amazon Athena、Amazon EMR、Presto等)访问相同的Amazon S3数据。
当使用预配置集群时,Amazon Redshift会利用名为Amazon Redshift Spectrum的节点组,将S3处理进一步隔离,并对计算层应用谓词下推和聚合等优化,提高查询性能。可下推到Amazon Redshift Spectrum的谓词运算符包括 = 、 LIKE 、 IS NULL 和 CASE WHEN ,聚合函数包括 COUNT 、 SUM 、 AVG 、 MIN 和 MAX 。
Amazon Redshift Spectrum处理Ama
超级会员免费看
订阅专栏 解锁全文
1234

被折叠的 条评论
为什么被折叠?



