
一、缘起
初步了解Alteryx的功能后,需要对Alteryx功能进行纵深了解。
从数据查看与分析的角度来说,
以前,专业人员使用SQL的Select来实现数据查看和分析的,
如今,业务人员通过Alteryx提供的可视化工具(Tool),也可以实现以前由专业人员通过SQL来实现的这些功能。
本文通过对照SQL与Alteryx的实现方法,教你从SQL转Alteryx做数据分析,用Alteryx实现SQL语句的功能。
英文版原文地址:https://www.alteryx.com/alteryx-sql
二、用Alteryx实现SQL的Select语句实现的效果
2.1.SQL的Select语句及实现效果

2.2.ALTERYX实现方法用到的Tool功能说明
2.2.1.输入数据工具(Input Data)
要访问Alteryx中的数据,可以将输入数据工具

拖放到画布上,找到数据库,然后选择。
在此示例中,输入数据工具允许您连接到SQL Server数据库。

2.2.2.选择工具(Select)

使用“ 选择工具”,可以更改数据类型,选择/取消选择字段,或者只是将字段重命名为您想要的任何字段。举例如下,CustomerID是字段名称。

2.2.3.连接工具(Join)

组合多个数据集,Join Tool允许你连接两个表具有共同字段(主键),Alteryx自动返回三套记录:
- 内连接(J):源表(L)中的列与表中的列连接(R),匹配基于公共字段的记录
- 左连接(L):原始表(L)的记录未在表中找到要匹配的连接(R)
- 右连接(R):要在源表(L)中找不到匹配项的待连接表(R)的记录
这是一个Join客户ID。

2.2.4. 数据库内关联工具(Join-InDB)
可以在不将数据移出数据库的情况下对大量数据进行混合和分析,并且与传统分析方法相比,可以显着提高性能。
Join-InDB可以让你做内,左外,右外,和全外连接。
在此处了解有关Alteryx In-Database工具的更多信息 。
2.2.5. 联合工具(Union)

联合工具可以让你多套基于字段名称或每列的位置的记录相结合。
您可以轻松更改每组记录中列标题的顺序,以便它们匹配。
这里,两组记录 - 左未连接记录和(内连接)记录 - 连接在一起,产生左外连接。


2.2.6. 过滤工具(Filter)
过滤工具

执行基于特定条件的限制记录 。过滤可以使用从简单比较到复杂的条件语句的任何内容。在此示例中,仅筛选那些国家/地区不包含美国的记录。

您可以使用过滤工具根据特定条件限制记录 。过滤可以使用从简单比较到复杂的条件语句的任何内容。此示例仅显示平均总计大于或等于1000的记录。

2.2.7. 合计工具(Summarize)Summarize Tool

允许您跨多个记录收集数据,应用聚合函数,并按一个或多个字段对结果进行分组。
在此示例中,汇总工具允许您按国家/地区(例如,英国,德国)进行分组,并平均每个国家/地区的总金额。

2.2.8. 排序工具(Sort)
排序工具

允许您以您需要的方式订购数据。选择列的名称,然后在升序或降序之间进行选择。在此示例中,平均总金额以降序显示。

2.2.9 Alteryx中实现SQL Select的完整工作流程

三、CROSS JOIN(交叉连接)
3.1. SQL实现方法及结果

3.2. ALTERYX实现方法用到的Tool功能说明
3.2.1.附加字段工具(Append)
使用附加字段工具

,您可以将源输入中的字段附加到目标输入的每个记录。对于源输入中的每个记录,将复制目标输入的每个记录。在此示例中,所有分发中心记录都附加到每个客户记录。

3.3.Alteryx中实现分发中心记录交叉连接客户记录的完整工作流程

四、WHERE BETWEEN(区间)
4.1. SQL实现方法及结果

4.2.ALTERYX实现方法用到的Tool功能说明
4.2.1.过滤工具(Filter)
过滤工具

将记录限制为具有特定范围内的字段值的记录 。
在此示例中,过滤器是2016年12月1日至31日(含)之间的订单日期。

4.3. Alteryx中实现过滤2016年12月1日至31日期间下达的客户订单数据的完整工作流程

五、WHERE IN(样本范围内)
5.1. SQL实现方法及结果

5.2.ALTERYX实现方法用到的Tool功能说明5.2.1. 过滤器工具(Filter)
滤器工具

将记录限制为具有属于一组可能替代方案的字段值的记录。
在此示例中,过滤器设置为其国家/地区是美国或英国的客户。

5.3. Alteryx中实现“国家/地区为美国或英国的客户”的完整工作流程

六、DISTINCT(去重)
6.1. SQL实现方法及结果

6.2. ALTERYX实现方法用到的Tool功能说明
6.2.1去重工具(Unique)
去重工具

可根据您选择的字段将数据分为两个流,即重复记录和唯一记录。
此示例中选择的字段是country。

6.3.Alteryx中实现根据选择的字段将数据分为两个流(重复和唯一记录)的完整工作流程

借助Unique工具,Alteryx工作流程可根据您选择的字段将数据分为两个流(重复和唯一记录),例如国家/地区。
(正文结束)
附1:关于本公众号
微信公众号名称:柴班说
欢迎转载与分享,也请注明出处。

附2:关于本文作者
微信号:chaijw
