数分面试题到底能不能面出真实水平​ ?

本文深入探讨数据分析师面试中的经典问题——APP日活跃用户数(DAU)下降20%的原因分析。从四大角度判断问题真实性,两个方向评估问题严重性,并掌握广度与深度分析框架,提供了一套系统的分析方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

数据分析师面试题到底能不能看出水平?

我的观点:能

 

我从一般的看涨看跌来说起,比如同比增长50%、环比下降60%,复合增长率仅为3%等等,这些都不陌生吧,都是大家常见的典型问题

 

这些为什么是典型的问题呢?增速或者减速的程度超出或者跌出了预期,当预期与实际有差异时,大脑的第一反应,这就是问题,但这真是的问题吗?这里给大家思考几秒,再继续读下去

 

我拿网上的一个面试题来大家做一个解析:

 

某日某APP的DAU下降了20%?

 

相信很多人都看过这个题的答案,也有一些博主用这个场景来作为数据分析师的工作场景(假设-验证)过程,当然要拿那些答案去应付要求不高的JD是没有问题的,但是要用这个题的答案拿高薪,那我就要给那些答案打个问号了?我解析一下我的思考过程:

首先是判断这是不是问题,四大角度:

1、DAU的定义是什么?也就是大家常说的这个指标计算的口径是什么样子的?

2、数据的可信度,这组数据来自哪里?大家都知道企业的数据库是很多的,而且之间的关系很复杂,是KPI级别的还是运营级别的,界定是不一样的

3、数据的真实性如何?这点很多人忽视了,比如别人拿了一个欠条,说你欠他钱了,你会做什么?我和核实这个的信息的准确程度,而不是你说什么就是什么

4、和谁比下降了?比的标准直接会决定你分析的方向

 

那回到我们的话题,某日某APP的DAU下降了20%?先要做DAU的定义,这个是DAU的界定是第一步

DAU是指一个用户启动一次APP算一个DAU与APP启动一次并停留3分钟以上算一个,分析的复杂程度是不一样的,直接会影响你后面的分析思维,一个是单一的行为分析,一个是行为+质量的综合分析,还有几个指标同时约束的定义,约束条件越多,问题分析的复杂程度越高,思维的要求也会越复杂。

第二步:这个数据来源是哪里?是来自我们日常的分析报告还是高层的汇报资料呢?这决定着这个数据的可信度到底如何?都很清楚,高层每天都要看各种报告,而且报告取数的地方都可能不同,难免会给看报告的负责人造成一定的假象。

 

第三步:数据的真实性,有几种常见的假设,1、假设数据的传输没有丢包现象:2、假设数据ETL的逻辑没有错误:3、假设最终数据计算的逻辑没有错误;4、假设最近没有实验测试:5、假设没有版本的变更;6、假设统计周期内没有宕机的情况等等

第四步,和谁比下降了?以上三步都搞清楚了,接下来就要看和谁比,和去年同期比,那分析的核心可能会是看去年与今年各类维度的多指标分析,和竞争对手比,那分析的核心可能更多是竞争对手的运营策略

当以上问题都搞清楚时,我们才明白了第一步,这是不是一个问题

其次判断问题的严重性,2个方向

当问题出现时,判断问题的严重性,对分析师来讲至关重要,这可能会影响你的分析框架和分析的周期、以及要对此付出的时间。

1、静态值比对,也就是我们常说的环比、同比,这个只是通过简单的比对得出的问题,那其实和分子、分母当时的业务环境有很大的关系,那就要找出一个极值来判断问题的严重性,比如本次下降20%,历史上我们最大值是下降10%或15%,问题的严重性是不一样的,也可以用竞争对手的幅度来作为基准。

2、动态值比对,很典型的就是复合增长、连续几天下降,这个与时间的周期有很大关系,一般来看统计周期的时间越久,问题的严重程度越高,比如连续3天下降与连续10天下降,问题的严重程度不一样的。

最后,把握好2个度

当你搞清楚了问题,并知道问题的严重程度时,面试官想要的分析框架也是不同的,框架不同,那薪水的定价自然不一样。

1、广度

框架,结构化思维,这个能帮助你做什么?比如我们要分析DAU下降的问题的,其实会有很多假设的,比如围绕APP来看,把APP当初一个指标,那切分的维度很有很多,对吧,这是分析师的基本要求,分时间、分城市、分用户类型等

做发散思维,这都是人类的强项,比如一件事情如果出了问题,我们通常会有N个理由来捍卫自己的利益,发散的好处就是让我们一定程度能够做到没有遗漏,但做不到彼此之间独立的归纳

比如围绕DAU有很多因素的影响,那你如何思考这些因素呢?这些因素在你的框架中是什么问题,能用“人话”说清楚吗?这时候我们日常学习的方法论就可以用上了,比如PEST、AAARRR、4P、5W2H等,其实简单来讲就是给你发散的思维要有一个约束的条件或者起点(对新手来讲作为起点更好用,对老手来讲是约束条件),这样发散+约束=好的框架

还有几个方式,比如按照用户的行为逻辑来思考、按照部门架构(市场、运营、产品、开发),按照商业元素(用户、产品、运营)等等

那其实面试的时候,这个属于你业务的广度,考量你对这个业务分析的宏观的思维过程,这个广度就需要你了解APP各个环节可能出现的问题,并对此进行假设,而这种假设要给它套一个约束条件,那就是我们常说的方法论,这样的好处就是你把你的分析思维做成了一种标准化商业化的话术。这个看着简单,但要在面试的时候快速的输出,还是要有大量的刻意训练的,冰冻三尺非一日之寒。

2、深度:

所谓的深度就是要找你熟悉的一个领域去引导,但实际中情况要复杂的多,可能多个方向综合对比后给出答案,毕竟是面试,一般人的引导有几个方向:

第一步假设:

假设新增用户表现好,是因为存量用户的疲劳造成?

假设是某些渠道带来的用户质量不高造成?

假设某个地区出现了竞争对手造成?

第二步:切入点

用户切入:新增VS存量

渠道切入:导航VS搜索引擎VS联盟VS商城

区域切入:省市区

第三步:验证假设,找出主要原因,做几个模拟的结论场景

1、发现了新增用户有问题,主要是新增用户减少导致,然后通过渠道分析得出是搜索引擎带来的新用户减少了X%,明显大于其他渠道,再分区来看,是某一地区出现竞争对手购买我们的关键字导致。

2、分析发现新增用户的增速虽高,但用户的质量却很低,进一步分析新增用户来源得知,某渠道来的用户质量相比平均值低X%。

3、存量用户的问题,存量用户对我们近期APP的运营策略感到不适,第一是变现意图太明显(广告增多),第二是无效信息推送过多(不是用户喜欢的)。

4、安卓系统升级导致,之前只要用户选择联网时,后台默认打开我们的APP,现在安卓系统升级,必须手动操作设置才可以自动打开

第四步:在模拟场景中找一个适合秀你的深度逻辑的场景开始

那2举例吧,我们第一步的假设得到了验证,是某渠道来的用户质量造成的,那接下来继续假设

1、渠道有问题,比如刷量、造假数据

2、渠道没问题,渠道的用户画像和我们产品的画像不相符,差异太大

3、渠道没问题,边际效用可能存在差异

......

边际效用这个可能大家不太好理解,可以理解为DAU指数是一个渠道衡量的指数,它与DAU高度相关,而这个指数是要根据用户的多种行为数据来综合加权计算,比如用户落地页面的浏览量、停留时长、回访、下载到开启APP的间隔时长等等,也可以描述一下你用的方法,比如因子、主成分、主观权重、AHP等

那这里面其实还延伸出你的几个认识领域,作弊分析、用户画像、综合评价

之后要做的就是重复以上的流程,直到整个问题从业务上能说通,从数据上有差异,有思路上有承接关系。

要是面试的话,没这么复杂,其实顺着一条线串下来就可以完美的解答,要想办法在你的思路中体现二个方面实力,1、你了解的领域很多,做过很多相关的主题;2、你善于用高级的分析方法解决现实问题;

实际中要复杂的多,要做好这个专题,那还是需要很多功底的,靠网上那些攻略是远远不够的。问题可深可浅、框架可大可小、方法可易可难,我们常说的数据分析入门容易,深入难就是这个原因,很难说那个好,也很难说那个不好,唯一的衡量就是你老板对你是否满意,年年给你加薪升职吗?真正差异会体现在3年以上,开始不开窍,以后开窍就可能来不及了,年龄不允许....一定想办法找个前辈带带你,会省很多路。

最后总结一下,先四大角度看“问题”,再2个方向判断问题严重性,最后把握好2个度去分析问题。注意做好,框架大而全,要说人话,分析有深度,围绕业务流程。


End


    销量下降,到底应该怎么分析?!    机器学习万字实战宝典!    数据分析里常用的五个统计学概念
小z微信坑位限时开放后台回复“芝麻开门”即可捕捉号主本人

“Nice!”

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值