利用 Power Query 深入挖掘数据价值与创建新列
1. 数据洞察与初步分析
在处理数据时,即使还未将数据加载到 Power BI 的数据模型中并创建可视化图表,我们也能获取很多有价值的信息。以下是一些数据特征:
- 电话号码长度 :多数电话号码长度为 12 个字符,但有 4 行长度为 19 个字符,以国际区号和空格(“1 (11) ”)开头。
- 婚姻状况分布 :婚姻状况在已婚(M)和单身(S)之间均匀分布(比例为 50:50),这在现实场景中可能并不常见。
- 薪资支付方式 :不到 20% 的员工将“SalariedFlag”设置为“true”,意味着超过 80% 的员工按小时计薪。
- 性别分布 :性别呈现二元分布,男性占 70%,女性占 30%。
- 部门分布 :绝大多数员工在生产部门,而行政部门仅有 3 名员工。
2. 使用 Table.Profile 函数获取数据概况
如果想基于列分布中的数据构建 Power BI 报告,Power Query 的 Table.Profile 函数会很有帮助。操作步骤如下:
1. 在“主页”选项卡的功能区中,选择“新建源”并选择“空白查询”。此时会创建一个名为“Query1”的新查询。
2. 编写第一行代码(也是此示例中的唯一代码行,注意行首要有等号):
= Table.Profile(Employee)
超级会员免费看
订阅专栏 解锁全文
9726

被折叠的 条评论
为什么被折叠?



