汇总重复数据

最新推荐文章于 2025-07-13 20:08:24 发布

原创最新推荐文章于 2025-07-13 20:08:24 发布 · 3.9k 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#数据分析

PowerBI 专栏收录该内容

68 篇文章

订阅专栏

本文通过一个简单的例子介绍了如何在数据分析中利用DAX先聚合后迭代的方法去除重复数据，从而优化计算效率。在处理具有大量数据的表时，此方法能显著减少迭代次数。文章还提及这种方法在预算分解或目标分解等场景中的应用，并强调了知识关联重组在学习过程中的重要性。

我曾捡到一束光，日落时还给了太阳

做过DAX性能优化的应该都知道，在做优化时有一个很常用的方法就是先聚合后迭代，这样当表的基数很大时，可以几何倍的减少迭代次数。虽然今天这个例子与性能优化无关，却也是应用的这种思路。

先来看下数据，value列存的是每个group的总值，也就说A的总值就是10。

如果我们还是按常规的方式计算Value，总计就会是140，事实上总计应该是10+15+20+10=55

value (error) = SUM( '表'[value])

前面已经介绍过了性能优化时常用的一个思路，放到这里其实是需要对数据去重

先按group进行聚合，然后增加@value列，
在计算MAX(‘表’[value] )时，外层需要包上CALCULATE进行上下文转换
最后对生成的中间进行迭代汇总计算

Value = 
var GroupValue = 
ADDCOLUMNS(
    SUMMARIZE(
'表',
'表'[group]
    ),
"@value", CALCULATE( MAX( '表'[value] ) )
)
var Result = SUMX( GroupValue, [@value] )
return Result

效果如下

这个例子很简单，但可能在第一次写的时候陷入误区，但仔细想想理清思路，代码写出来又会发现其实很简单。这也是为什么我在带人时，时常说先别急着做，先倒推下为了得出结果需要什么，然后把需要的通过变量的方式，一步步算出来就好。其实看到这个例子中的数据时，让我想到的是另一类案例，做过预算分解的人或者目标分解的应该会觉得很眼熟，因为目标表通常也是只到年或者月，比如下面这个例子

这个计算更相对更简单了，只需计算时在Date表和Plan表之间使用虚拟关系即可

Plan = CALCULATE ( SUM( 'Plan'[Plan] ), TREATAS( VALUES( 'Plan'[Year]),'Date'[Year] ))

然后再根据具体的业务逻辑看怎么拆分到月或者日就好。

这也是使用笔记工具记录知识以来最大的一个感触，每一次新知识的获取，都会对已有知识进行一次关联重组，这也是为什么近几年双链笔记软件这么盛行的原因，确实可以有效的帮助我这样不怎么聪明，又不怎么擅长整理的人。

PowerBI木小桼

powerbi、dax、设计模式、SSAS

49篇原创内容

公众号