【读书笔记】《深入浅出数据分析》

文章通过多个案例展示了结构化思维在数据分析中的重要性,包括确定问题、分解问题、评估和决策的步骤。强调了数据分析的目的在于辅助决策,而心智模型对分析结果的影响显著。文中提到了观察、对比、实验等分析方法,以及贝叶斯规则、主观概率等统计工具在实际问题解决中的运用。此外,还讨论了如何通过图形化工具如直方图来展示数据分布,以及在面对不确定性和争议时如何运用启发法进行决策。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

我最大的收获

试想你在经历一场英语考试,还有两分钟就要交卷了,而你还没有开始写作文。此时,你会怎么做?
利用2分钟时间写出的第一段,还是只写关键句子,搭出文章的开头、过程、结尾?
后者更加明智。这也告诉我们结构完整的重要性。
在工作中,结构性意味着全局思考、闭环、方法。这本书给我最大的帮助,也是再次认识到了结构重要性。确定-分解-评估-决策。

数据分析的目的:通过数据分析,做出更好的决策。认清问题并解决问题。

影响分析结果的关键:一个人的心智模型。一个人的假设+观点=心智模型。

优秀的数据分析师帮助客户思考自己的问题,他们不会等着客户告诉他们该做什么。

数据分析,无法得出适用于所有情况的正确的策略。

数据分析的步骤:

数据分析的方法:观察、对比、实验

使用正确的心智模型进行分析:知道自己知道的,知道自己不知道的。

知道自己知道的=认知可以用数据验证

知道自己不知道的=哪些方面缺乏了解

案例一:保湿霜生产厂商想要提升销售。

分析步骤:确定-分解-评估-决策方法使用。

分析过程:确定需求是销售额提升到目标值。分解销售额来源于不同的供应商。评估发现供应商将货品卖给了男性客户用于剃须。决策开发男性市场。

我学到的:外部世界信息很多,方向错误会迷失在数据的海洋里。找方向的关键是心智模型。心智模型=假设+观点。

案例二:咖啡店的销售额下降,需要找到原因进行提升。

分析方法:观察法、实验法、对比法

分析步骤:确定(已知)--分解(分区域)--评估(实验法)--决策(根据实验结果)

分析过程:观察发现用户调研显示咖啡价值下降。拆解问题发现是XX区域用户对咖啡价值评价下降。制定降价和游说用户两种提升方法,采取同期实验法测试。对比实验数据形成解决方法。

我学到的:实验法的使用。选择同期实验方法而不是历史实验法、排除混杂因素、随机分组(将咖啡店按照区域分组,然后使用RUND公式实现随机分组)。

案例三:生产商可以生产橡皮鸭和橡皮鱼两种商品,各自有不同的利润,各生产多少可以利润最大化?

数据分类,可控因素与不可控因素

明确决策变量、可控因素

使用Solver公式,求出可控因素为多少时,得出利润最大值。可控因素:具体生产多少只。限制条件:橡胶的数量、产能的限制、用户的需求。

我学到的:业务影响因素分可控和不可控,不可控因素无法干预,但应该知道并提前采取措施。

案例四:网站改版,有三套首页设计,应该选择哪种?

数据以图形方式呈现,简单直观。

图形数据化工具:excel、illustrator、R程序、Edward Tufte的书

案例五:生产手机壳的公司,怎么去预测新手机发布时间?

分析方法:假设检验的证伪法

分析步骤:收集信息、大胆预测、用证伪法排除错误预测、诊断证据和假设之间的关系,找到最强假设。

我学到的:证伪法可以克服人们专注于错误答案而无视其他答案的天然倾向。

案例六:检测结果阳性,真正患病的概率是多少?

分析方法:贝叶斯规则

分析步骤:社会中患病人数1%=基础概率,患病检测结果阳性概率90%、未患病检测结果阳性10%、条件概率。基础概率和条件概率结合算出检测结果阳性,患病概率。

案例七:分析师们对事情发生概率的看法不一,如何判断?

分析方法:主观概率

分析步骤:请分析师对于事情发生的概率用%表示。散点图每个点表示一位分析师的看法,可以直接观察出倾向性。使用标准偏差STDEV公式(Standard Deviation),可以计算出大家对于事情的实际争议程度大小。

案例八:宣传不要乱扔垃圾的公司,如何说服市政府持续对公司的投入?

治理扔垃圾的效果没有直接的数据、收集数据成本高、难以量化、用户调研不具有代表性。

分析方法:启发法,快省树

我理解是列出市民扔垃圾意识、行为改变的过程,体现这个公司的业务模型的价值。

案例九:直方图

已知公司内历史加薪情况,包含性别、提出加薪幅度、年份与实际加薪之间的对应关系。

如何表示加薪结果的分布?直方图

表现形式的积累:

1、折线图,X轴月份,Y轴销售额,目标值是虚线,实际值是实线,直接看出完成程度。

2、步骤A到B,中间用箭头表示,箭头上方文字写明AB之间的关系。

3、步骤A到B1、B2到C1-4到D,总分总形式,树形流程图,凸显过程与结论。

4、散点图:X轴代表自变量=原因、Y轴代表应变量=结果、散点体现数据分布。虚线代表散点的均值或者目标值。

5、两个变量之间,是正向关系还是负向关系,两个变量中间用双箭头表示,中间一个圆圈写+或者-,表示正负关系。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值