Tableau 中的组(group)与集(set)

本文介绍了Tableau中组和集的基本概念及应用场景。组是将具有相似特性的维度成员组合在一起;集则是根据特定条件定义的数据子集,用于筛选符合特定逻辑的数据。两者虽有相似之处但在使用场景上有所不同。

学习记录:

1)首先看看官方的定义:组是构成更高级别类别的维度成员的组合。单独理解的确有点不明白,通过具体的例子去认识一下什么是组。举一个生活中常见的例子,如,苹果、香蕉、鞋子、衣服、自行车。如果我们要分组,一般分为三大类:水果(苹果、香蕉),衣服(鞋子、衣服),自行车。当然tableau中的组也这类似。再看一个tableau的组的示例:
    以示例的excel数据源为例,对Category进行分组,
这里写图片描述 
        将Category放到Rows,Sales放到Columns中,按住键盘上的Ctrl 或Shift 键以同时选择视图中的多个标题。单击工具栏上的“组”按钮。也可以右键单击并选择“组”,或者单击工具提示上的“组”图标。这样就创建了组:
这里写图片描述 
        我们可以看到,前边选择的三个合并为一个,即创建了一个组,其实就将你想要的维度归为一类,这就是组的概念。
2)集(set):集是根据某些条件定义数据子集的自定义字段。集可基于计算条件建立。
        在 Tableau 中可使用多种方法创建和编辑集。您可以通过在视图中选择标记或标题或者在数据窗口右键单击字段来创建集。也可以创建基于事先定义的筛选器的集。无论创建集的方式如何,它均是常量集或计算集。
这里写图片描述 
        这个是购买过20 次的客户的销售额占总销售额的百分比创建的集,customerName作为维度。集的结果为in或者out。
        两者的区别:其实在一定程度上,集和组是一样的,但他们又有着不同,组是将相同的类型的维度值归为一类,而集可以理解为一个逻辑值,符合条件的为true即结果中的in,不符合条件的为false即结果中的out,但又不完全是这样。

转载于:https://www.cnblogs.com/cherxu/p/5604100.html

### 如何在 Tableau 中添加或创建维度以及处理缺失的维度问题 #### 添加或创建维度 在 Tableau 中,可以通过以下方法来添加或创建新的维度: 1. **直接拖拽字段到“维度”区域** 如果数据源中已经存在某个字段,并且该字段适合作为维度,则可以直接将其从“度量”或其他类别拖放到“维度”区域。这会自动将此字段转换为维度[^3]。 2. **自定义计算字段** 当现有字段无法满足需求时,可以利用 Tableau 的计算功能创建一个新的维度字段。具体操作如下: - 转至菜单栏中的 `Analysis` -> `Create Calculated Field`。 - 编写一个表达式以生成所需的维度值。例如,如果需要基于日期字段提取年份并作为一个新维度,可以用以下代码: ```sql YEAR([Date]) ``` 创建完成后,这个计算字段会被视为一个新的维度[^1]。 3. **分合作为虚拟维度** 使用 Tableau 提供的分(Group)或者(Set)功能也可以构建逻辑上的维度。比如,可以根据某些条件动态划分客户群体或将多个离散值合成更大的分类单位。 #### 处理缺失的维度问题 当发现视图中有维度丢失的情况时,可以从以下几个方面着手解决问题: 1. **检查数据连接设置** 验证当前所用的数据源是否包含了预期的所有列/字段。如果没有找到对应的维度字段,请重新配置数据导入过程,确保完整的结构被加载进来。 2. **修复断开链接的字段映射** 若之前已有的维度突然消失,可能是由于底层数据模型发生了变化(如重命名表头)。此时应打开“Data Source”页面查看是否有未匹配成功的字段,并手动调整其对应关系。 3. **填充空缺值** 对于那些因为空白(null)而导致显示异常的部分,可以在准备阶段预设默认替代项;或者借助 Tableau 自带的功能,在右键点击目标字段后选择“Replace Nulls”,指定填充值[^2]。 4. **优化查询语句** 基于前述提到的内容,“Group By”子句决定了哪些独特的属性能够参最终渲染结果之中。因此,确认 SQL 层面没有遗漏必要的聚合依据也是至关重要的一步。 ```python # 示例 Python 伪代码演示如何在外围脚本里补充可能遗失的关键参数 def ensure_dimension_inclusion(dataframe, required_dimensions): existing_cols = set(dataframe.columns) missing_dims = list(set(required_dimensions).difference(existing_cols)) for dim in missing_dims: dataframe[dim] = None # 或者赋予其他合理的初始状态 return dataframe ``` ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值