学习数分--简单案例1

业务背景:某服务类app,近期发现日新增用户数下滑明显。

具体描述:假设公司产品(一款本地服务类app),近期发现日新增用户数下滑明显。老板要求你分析:数据异动的原因是什么?

        #最开始你只有“问题”sheet中的数据。其他数据是随着分析深入,和业务部门沟通获取的。#

1、解决问题的思路:明确问题--分析原因--提出建议

  (1)将数据简单转化为图型(如下图),观察;

  明显12.10-12.13日数据有一个明显的下降,再从同比和环比的角度来分析下问题;

  什么是同比?什么是环比?

  • 同比:通俗地讲为,今年的第n月与去年的第n月比;
  • 环比:通俗地讲讲,与上期的比较,例2023年7月份与2023年6月份相比较称其为环比。

    先获取到问题数据上个月的数据以及去年同阶段的数据;再次通过数据透视表直观的对比如下图:

    a.同比结果:

   b.环比结果:

从给出的用户数据来看,明显从12.10-12.14时间段,新增用户数明显降低。所以问题已明确:12.10-12.14时间段,新增用户数降低。

2、分析原因 

常见的分析方法包括:多维度拆解分析方法、假设检验分析方法。

本例中使用“多维度拆解分析方法"对问题进行拆解,将一个复杂问题细化成各个子问题;再对拆解的每个部分,使用“假设检验”找到哪里出了问题。

(1)从数据属性分析:用户的性别、用户的年龄、新用户渠道、用户所在城市;从这四个维度下手分析; 

   对各个维度的进行问题假设如下

     需要跟业务部门沟通,获取到相关数据。

  • 假设是性别原因导致的新增用户下降,根据如图统计结果显示

从圆环图中看出,两个日期阶段男女比例没有明显变化,都是50%左右。因此假设1不成立。

  • 假设是年龄原因导致的新用户数下降。

需要收集数据下降前后(12月10之前和之后)的年龄比例数据,进行论证。

3得出结论:

从折线图对比看出,12/10- 12/13的组别中(橙色折线),23及以下的新增用户占比明显更少。因此假设2成立,23及以下年龄段出现异常。

  • 假设是城市原因导致的新增用户数下滑

由图可见,两个指标在不同城市的占比基本相同。

  • 假设是渠道原因导致的新增用户下滑,复制数据表,调整字段生成图:

从折线图对比看出,12/10- 12/13的组别中(橙色线条),抖音推广页的新增用户占比明显更少。因此假设4成立,抖音推广页出现了问题。

  • 总结上述四种假设

补充假设- 漏斗分析方法:从业务流程出发防止遗漏问题

用户成为新增用户前,要经历渠道曝光- 点击- 下载- 注册的漏斗阶段。因此需要补充分析,是否某个漏斗阶段出现问题,导致新增用户减少。

和业务部门沟通获取12/10- 12/13的用户点击率、下载率和注册率数据。

做图表,发现12/10-12/13注册率是下降的;而其他两个指标无明显变动;因此补充假设成立,注册率明显下滑。

最终结论:

23岁以下用户减少;抖音新增渠道用户较少;业务流程节点-注册率偏低

提出建议:
  1. 调研23岁一下用户喜欢的模板和内容;增加设计风格;
  2. 抖音素材轮换;A/B测试效果更好的素材;
  3. 用户调研,不喜欢产品风格?板块不满足预期?/注册流程太复杂?无新手引导?
拓展-数据透视表小tips:

1、选中要做数据透视表的数据;然后点击‘插入-数据透视表’

2、为了数据的直观,可以选择‘数据透视图’或者

3、让数据表'动起来',切片器

那么,如何做到单切片器控制多个数据透视图,以便方便查看数据呢

4、当多折线图,数值差距太大,可以选择次坐标轴折线图。

    

5、什么场景需求适用什么表(本图为网上收集,如有侵权,私聊删除)

### 数据分析面试的经验与技巧 数据分析和数据科学领域的工作竞争激烈,因此准备充分对于成功通过面试至关重要。以下是针对数据分析和数据科学面试的一些经验和技巧: #### 明确岗位需求 大中型企业的数据分析岗位通常包括但不限于数据分析师、数据科学家等职位[^1]。不同公司对这些角色的具体职责定义可能会有所差异,但核心技能要求往往围绕以下几个方面展开。 #### 结构化面试流程 在数据分析面试过程中,建议遵循一种结构化的思路来展示自己的能力[^2]: - **确定目标**:清晰理解业务背景以及具体要解决的问题是什么。 - **搭建框架**:构建合适的数据分析体系并设定可量化的关键绩效指标(KPIs)。 - **获取数据**:熟悉如何从数据库或其他来源提取所需的信息。 - **数据清洗**:掌握处理缺失值、异常值等问题的技术手段。 - **深入分析**:运用统计模型或者机器学习算法挖掘潜在规律。 - **撰写报告**:能够有效地向非技术受众传达发现的价值所在。 #### 技术知识点复习 除了上述软实力之外,还需要扎实掌握一些硬核的知识点,在此列举几个常见的考察方向及其应对策略[^3]: - SQL查询优化: 能够熟练编写复杂SQL语句, 并能解释执行计划. - 统计基础理论: 对概率分布函数(PDF), 假设检验原理要有深刻认识. - 编程语言应用: Python/R 的常用库如Pandas,Numpy,Scikit-Learn 应达到灵活使用的程度. 另外值得注意的是关于机器学习部分的内容也经常会被提及到比如监督/无监督分类回归预测任务中的经典算法概念实现细节评估标准等等都需要有一定涉猎范围内的积累才行 . ```python import pandas as pd from sklearn.model_selection import train_test_split from sklearn.linear_model import LogisticRegression from sklearn.metrics import accuracy_score # Example of a simple logistic regression model using scikit-learn library in python data = {'feature_1': [0.1, 0.4], 'label': ['negative', 'positive']} df = pd.DataFrame(data) X_train, X_test, y_train, y_test = train_test_split(df[['feature_1']], df['label'], test_size=0.2, random_state=42) model = LogisticRegression() model.fit(X_train, y_train) predictions = model.predict(X_test) print(f'Accuracy Score:{accuracy_score(y_test,predictions)}') ``` 以上代码片段展示了利用Python中的scikit-learn库创建一个简单的逻辑回归模型的过程作为例子说明实际操作层面的能力体现方式之一种形式而已并非唯一途径当然还有更多高级复杂的场景等待探索实践当中去不断精进完善自我水平提升竞争力最终赢得心仪offer的机会!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值