汇总重复数据

本文通过一个简单的例子介绍了如何在数据分析中利用DAX先聚合后迭代的方法去除重复数据,从而优化计算效率。在处理具有大量数据的表时,此方法能显著减少迭代次数。文章还提及这种方法在预算分解或目标分解等场景中的应用,并强调了知识关联重组在学习过程中的重要性。

图片

17

我曾捡到一束光,日落时还给了太阳

做过DAX性能优化的应该都知道,在做优化时有一个很常用的方法就是先聚合后迭代,这样当表的基数很大时,可以几何倍的减少迭代次数。虽然今天这个例子与性能优化无关,却也是应用的这种思路。

先来看下数据,value列存的是每个group的总值,也就说A的总值就是10。

图片

如果我们还是按常规的方式计算Value,总计就会是140,事实上总计应该是10+15+20+10=55

value (error) = SUM( '表'[value])

图片

前面已经介绍过了性能优化时常用的一个思路,放到这里其实是需要对数据去重

  • 先按group进行聚合,然后增加@value列,

  • 在计算MAX(‘表’[value] )时,外层需要包上CALCULATE进行上下文转换

  • 最后对生成的中间进行迭代汇总计算

Value = 
var GroupValue = 
ADDCOLUMNS(
    SUMMARIZE(
'表',
'表'[group]
    ),
"@value", CALCULATE( MAX( '表'[value] ) )
)
var Result = SUMX( GroupValue, [@value] )
return Result

效果如下

图片

这个例子很简单,但可能在第一次写的时候陷入误区,但仔细想想理清思路,代码写出来又会发现其实很简单。这也是为什么我在带人时,时常说先别急着做,先倒推下为了得出结果需要什么,然后把需要的通过变量的方式,一步步算出来就好。其实看到这个例子中的数据时,让我想到的是另一类案例,做过预算分解的人或者目标分解的应该会觉得很眼熟,因为目标表通常也是只到年或者月,比如下面这个例子

图片

图片

这个计算更相对更简单了,只需计算时在Date表和Plan表之间使用虚拟关系即可

Plan = CALCULATE ( SUM( 'Plan'[Plan] ), TREATAS( VALUES( 'Plan'[Year]),'Date'[Year] ))

然后再根据具体的业务逻辑看怎么拆分到月或者日就好。

这也是使用笔记工具记录知识以来最大的一个感触,每一次新知识的获取,都会对已有知识进行一次关联重组,这也是为什么近几年双链笔记软件这么盛行的原因,确实可以有效的帮助我这样不怎么聪明,又不怎么擅长整理的人。

PowerBI木小桼

powerbi、dax、设计模式、SSAS

49篇原创内容

公众号

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值