从零开始Tableau | 6.分层与分组

本文详细介绍了在Tableau中如何进行数据分层和分组,包括视图标题分组、视图标记分组和维度字段分组的方法,以帮助用户更好地组织和分析数据。
部署运行你感兴趣的模型镜像

 

在tableau中,数据分层与数据分组常用来对维度字段之间或者维度字段内部进行数据的重新组织。本节记录要点:

  • 数据分层
  • 数据分组

数据分层

数据分层是一种维度字段之间自上而下的组织形式,tableau中默认包含了一些特殊字段的分层结构,比如日期、地理角色。以日期字段为例,一个标准的日期字段有“年、月、日”三个时间值,如“2018-08-28”,tableau将该日期默认表现为“年-季-月-天”的分层结构。

图:日期分层结构示例
图:日期分层结构示例

 

尽管tableau内置了几种分层结构,但在实际应用中,仍然存在大量需要创建分层结构的场景,以便于数据分析时对数据进行上钻或下钻。创建数据分层结构的具体步骤如下。

1.在数据窗口的维度区域,选择需要创建分层结构的多个字段。

图:创建分层结构字段
图:创建分层结构字段

2.根据需要,对创建的分层结构字段名称进行重命名,并按照由大到小、由上至下的原则调整字段顺序。

图:分层结构重命名和调整顺序
图:分层结构重命名和调整顺序

3.完成分层结构创建,并将创建的字段拖放到列行功能区,在视图中观察使用分层结构。

图:分层结构下钻测试示例
图:分层结构下钻测试示例

4.如果还要进一步扩展分层结构,只需在维度区域中,将待扩展的字段直接拖放到分层结构字段中,并选择好适合的位置即可。

图:扩展分层结构字段示例
图:扩展分层结构字段示例

 

数据分组

在tableau中,“组”是维度字段成员的组合。通过分组,可以对维度字段成员的重新组合。如,假设维度区域有一个“学科”字段,该字段有语文、数学、化学、物理、英语五个成员,可以通过分组,将数学、化学、物理分归为“理科”,这样就能够对理科情况进行分析。

在实际操作中,可以通过视图标题、视图标记、维度字段进行直接分组。

视图标题分组

1.在视图中,直接在字段标题选中需要分在一组的维度成员,然后点击通过选择“组”选项,实现分组创建。这里,选中国内作者,将他们分在一组。

图:通过视图标题分组示例
图:通过视图标题分组示例

2.视图中默认的组名称是组成员的组合,可以对其重命名,以便更贴近所分的组的特点。这里,将分组名称重命名为“国内作者”。

图:分组重命名示例
图:分组重命名示例

3.在“列行”功能区的分组字段上,通过右键菜单中的“包括 ‘其他’”选项,可以将未分组成员合并为“其他”,将他们视作一个整体进行分析。

图:未分组字段成员合并示例
图:未分组字段成员合并示例

 

视图标记分组

1.直接在视图标记中选中需要分在一组的成员,通过右键菜单创建分组。这里,建立维度为“子类别”,度量为“数量”和“利润”的散点图,并将价格低、销量低的子类别分为一组。

图:单维度视图标记分组示例
图:单维度视图标记分组示例

2.创建分组后,tableau默认将没有被选中的成员归为“其他”组,并与创建的分组用颜色进行了区分。同样,也可以根据需要对组名称进行重命名。

图:单维度视图标记分组结果
图:单维度视图标记分组结果

3.如果视图具有多个维度,如上面视图在已有的“子类别”维度基础上,再增加一个“地区”维度,那么选中视图标记并进行分组的时候,会有三个选项供选择,分别是“所有维度”、“地区”和“子类别”。

图:多维度视图标记分组
图:多维度视图标记分组

4.如果选择“所有维度”,则被选中的5个标记将分在一组,其余标记将被分在“其他”组。

图:按"所有维度"分组示例
图:按"所有维度"分组示例

5.如果选择“地区”,则符合5个标记所涉及地区(华东和中南)的所有标记都将分在一组,其余标记将被分在“其他”组。

图:按"地区"分组示例
图:按"地区"分组示例

6.如果选择“子类别”,则符合5个标记所涉及子类别(书架、收纳具和椅子)的所有标记都将分在一组,其余标记将被分在“其他”组。

图:按"子类别"分组示例
图:按"子类别"分组示例

 

维度字段分组

在数据窗口的维度区域,在选择创建分组的字段上,通过右键菜单进入分组界面,并在该界面中选择相应的维度字段成员进行分组和重命名。如果字段中的成员较多,并且需要对该字段成员创建多个分组,这种方式分组会更有效。

图:维度字段分组示例
图:维度字段分组示例

分组是重组维度字段成员的常用方式之一,不论通过何种方式创建组,在数据窗口的维度区域,都会添加一个新的组字段,该字段可以向其他维度字段一样使用,比如拖放到“列行”功能区、“标记”卡、“筛选器”卡等。但分组结果不能用于计算,即“组”不能出现在公式中


您可能感兴趣的与本文相关的镜像

Stable-Diffusion-3.5

Stable-Diffusion-3.5

图片生成
Stable-Diffusion

Stable Diffusion 3.5 (SD 3.5) 是由 Stability AI 推出的新一代文本到图像生成模型,相比 3.0 版本,它提升了图像质量、运行速度和硬件效率

### 如何描述从零到一构建数据中台项目的经历 构建数据中台项目的过程可以分为明确需求、设计架构、开发实现、测试优化和部署上线等多个阶段。以下是从零开始构建数据中台项目的经历描述示例: --- #### 1. **需求分析问题定义** 在实际业务场景中,企业通常面临五大核心问题:找数据、理解数据、问题评估、取数及可视化展现[^1]。为了从根本上解决这些问题,需要深入调研业务部门的需求,了解数据的来源、用途以及当前存在的痛点。通过业务团队的多次沟通,明确了数据中台的目标是提供统一的数据服务,支持快速决策和高效开发。 #### 2. **技术选型架构设计** 根据需求分析结果,设计了一个分层架构的数据中台系统,包括数据采集层、数据存储层、数据处理层、数据分析层和数据展示层。 - **数据采集层**:通过ETL工具或API接口从不同数据源(如数据库、日志文件、第三方系统)获取数据[^1]。 - **数据存储层**:选择分布式数据库或数据仓库(如Hadoop、Hive、ClickHouse)作为存储引擎。 - **数据处理层**:使用Spark或Flink等大数据处理框架对数据进行清洗、转换和聚合。 - **数据分析层**:引入机器学习模型或规则引擎,支持复杂的数据分析任务。 - **数据展示层**:通过BI工具(如Tableau、Power BI)或自定义前端界面实现数据的可视化呈现。 #### 3. **开发实现** 在开发过程中,团队采用了敏捷开发模式,将整个项目拆分为多个迭代周期。每个迭代专注于完成特定的功能模块: - **数据集成**:编写脚本或配置流程,确保数据能够从源头准确采集并导入到数据中台。 - **数据建模**:设计标准化的数据模型,减少冗余和不一致性。 - **接口开发**:为业务系统提供RESTful API或GraphQL接口,方便调用中台数据服务。 - **性能优化**:针对高并发查询场景,优化SQL语句、索引结构和缓存策略。 #### 4. **测试优化** 在开发完成后,进行全面的功能测试、性能测试和压力测试。通过模拟真实业务场景,发现并修复潜在问题。例如,在大规模数据导入时,曾遇到内存溢出的问题,通过调整Spark参数和增加节点资源得以解决[^1]。 #### 5. **部署运维** 将数据中台部署到生产环境后,建立了一套完整的监控和告警机制。通过Prometheus和Grafana等工具,实时监控系统的运行状态,并及时处理异常情况。此外,还制定了详细的操作手册,帮助运维人员快速上手。 #### 6. **成果总结** 经过数月的努力,数据中台成功上线并取得了显著成效: - 数据查找时间缩短了80%,业务人员可以更快地获取所需数据。 - 数据质量显著提升,错误率降低了95%。 - 可视化报表生成效率提高了3倍,支持动态交互式分析。 --- ### 示例代码 以下是数据中台中一个简单的ETL任务示例,使用Python实现数据清洗和加载: ```python import pandas as pd def clean_data(input_file, output_file): # 读取原始数据 df = pd.read_csv(input_file) # 数据清洗 df.dropna(inplace=True) # 删除空值 df['date'] = pd.to_datetime(df['date']) # 转换日期格式 # 数据加载 df.to_csv(output_file, index=False) # 调用函数 clean_data('raw_data.csv', 'cleaned_data.csv') ``` --- ###
评论 2
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值