一本好书会让人有读时恍然大悟,读后茅塞顿开的赶脚,最近我读了《数据化运营:系统方法与实践案例》这本书后就是这种感受,要是能合着《精益数据分析》一起“内服”,效果更佳,瞬间打通任督二脉,忍无可忍只好把读书笔记分享一波。提前预警!!!本文很干,请自备茶水!
一、数据运营、数据分析之间的辩证关系
在说数据运营之前,首先得了解运营是什么?从广义来说,一切能够进行产品推广、促进用户使用、提高用户认知的方法与活动都是运营。运营的终极目标是使产品能持续稳定地、更好地生存下去。好的运营是通过推广、引导、活动等一系列举措让产品的各个指标得到提升。
数据驱动运营就是通过数据分析与用户行为研究让产品的功能不断完善,适用性不断提升,使产品有更长的生命周期。
个人理解也就是《精益数据分析》中提到的“构建”——“衡量”——“学习”的循环。
二、数据运营“硬实力”
数据驱动运营,需要一套支撑数据应用的“硬件能力”。这套能力体现在数据的流转环节,从海量的数据中提取出有用的模式并对其进行分析、挖掘、应用,包括:数据采集(埋点、爬虫),数据加工、清洗、建模、挖掘到最后支持到上游的应用。书中用一张图将”硬实力“提炼出来:
其中,数据源包括企业内部的OA数据、财务数据、业务数据、日志数据、埋点数据以及外部数据。经ETL后存储到数据仓库中,数据仓库包含三层。
ODS层是各业务系统的源数据,会对操作型环境中的数据进行简单的格式解析、多数据源的合并、设置字段默认值等操作
DW层对ODS层进行建模加工,提供统计汇总数据。
DM层根据DW层的数据,为各个业务单元定义的集市,输出相关的主题宽表
有了上面的硬件基础,企业的数据管理部门还需要对各业务条线的数据梳理出一份全量业务的数据字典,方便数据分析人员借助数据字典了解公司的全景数据,明确数据的分布和蕴含意义。数据字典的能否在企业级的层面做到及时更新,也是数据“硬实力”的重要组成部分。
此外,数据建模层和数据应用层主要是对数据仓库中的数据进行利用与挖掘,数据建模层主要方便地对数据分析人员查询分析数据、BI报表的实时展示以及数据挖掘工程师对数据的深度建模与挖掘提供支撑。数据应用层是数据价值产生的出口,可以认为面向的用户是全体管理人员和业务人员,而不是数据分析人员,可以提供用户的智能营销以及个性化内容推荐等功能。
三、数据运营“软实力”
数据运营软实力,主要是对人的能力要求。数据团队作为各业务部门的支持方,团队内成员主要从事数据采集、清理、分析、策略、建模等工作,支撑整个运营体系朝精细化方向发展。常见岗位包括:数据分析师、算法工程师、爬虫工程师、数据挖掘工程师等。从工作内容分为:数据治理、数据分析挖掘、数据产品三个层次。
数据治理:
优质的数据是应用的前提。数据治理负责数据系统的架构规划、数据的标准和规范化作业、数据的权限管理,保证数据的安全性和可用性,定义各业务口径的数据标准,构建数据集市和底层数据架构,输出支持到分析人员应用的数据字典。
数据分析挖掘:
数据分析是数据运营的重点工作,其核心是业务方向的数据分析支持。主要包括:
对业务活动进行效果评估以及异常分析,如异常订单分析、异常流量分析,挖掘业务机会点,给予运营方建议及指导;
收集整理各业务部门的数据需求,搭建数据指标体系,定期向业务部门提交数据报表,包括日报、周报、月报等;
数据价值挖掘,如基于用户行为数据建立用户画像、建立RFM模型对客群进行聚类营销;
辅助管理层决策,对问题进行定位,输出可行性建议,辅助管理层进行决策。
数据产品:
负责梳理各部门对数据产品的需求,规划报表并优化报表,协调数据仓库的开发资源保证项目按时上线。将数据分析部门建立的挖掘模型、用户画像等数据模型做成可视化产品输出。企业内部常见的数据产品包括数据管理平台和自助数据提取平台。其中数据管理平台支持运营日报查看、实时交易数据查看、业务细分数据查看;自助数据提取平台满足业务方对更细纬度业务数据的需求,解放数据提取人员的重复性工作。
数据运营人员需要技能与能力
1、EXCEL数据处理与绘图
2、SQL类语言
3、Python语言
4、PPT制作能力
5、业务理解能力
四、数据运营方法论
战略方法论
1、4P营销理论
产品(Product)
目前销售的产品有哪些?其中哪些实现了盈利?哪些还在亏损
产品如何满足用户需求
产品的目标用户是谁?
…
价格(Price)
产品定价机制怎么样?总体收入如何?毛利如何?
价格、用户期望、成本、毛利、市场供需之间的关系如何平衡的?
促销(Promotion)
有哪些促销方式?哪些促销方式的效果最好?
线上、线下促销对比,投入产出比怎么样?
渠道(Place)
各个渠道的渠道质量如何?
各个地区渠道覆盖率如何?
用户对各个渠道的偏好如何?
2、5W2H
what何事、why何因、where何地、who何人、how如何执行、how much何价,此方法比较适合应用于项目的规划和架构建设,尤其是在向领导汇报时可以采用。
3、PEST
PEST一般用于对宏观环境的分析。P(political 政治环境)E(economic 经济环境)S(Socail 社会环境)T(technology 技术环境)。
4、SWOT
SWOT是战略分析的一种方法。S(strength 优势)、W(weakness 弱势)、O(opportunity 机会)T(threat威胁)
5、逻辑树
将问题拆解成小问题。拆解原则MECE(相互独立、完全穷尽)
战术方法论
6、多维分析
对于指标维度的细分,包括维度的下钻细分,上卷聚合。
7、趋势分析
同类指标基于不同时间周期的对比,主要是指标的同比和环比
8、综合评价法
综合评价法是通过将多个指标整合成一个综合指标来评价的方法,评价过程中会涉及到指标权重的设定,可分为主观赋权法和客观赋权法(变异系数法、熵权法、主成分分析法)对这一部分感兴趣的朋友可以读一下小狮之前分享的文章《论权重》
9、转化分析
转化分析用于分析产品的流程或关键路径转化效果,常借助漏斗图展现转化效果。常用方法AARRR分析方法即获取用户( Acquisition)、提高活跃度( Activation)、提高留存率( Retention)、获取营收( Revenue)和自传播( Referral),简称 AARRR
10、数据挖掘方法
这里主要是聚类、分类、回归、关联分析等机器学习方法
11、可视化
环形图、矩阵图、组合图、词云等适用场景
12、ABTest
对比实验法,常用于决策优化、网页优化、产品优化、运营策略的一种比较策略。
13、其他方法
还有一些其他数据分析方法本书中没有提到,比如:二八分析、象限图法、杜邦分析法、RFM等读者可自行百度学习。
五、案例分析
1、案例竞品数据对标分析
这个案例全篇都在讲爬虫,网页获取、解析、数据存储、爬虫部署等相关内容,这部分内容大家可参考我之前的文章《白话网络爬虫——入门篇》,个人感觉这个案例更像是爬虫工程师的工作,读者可自己选择是否阅读。
2、用户特征分析
主要是为了了解用户特征优化运营策略。分为基于用户细分的行为分析,研究活跃用户、新用户、老用户、流失用户、回访用户在产品中行为特征;用户来源渠道分析,对用户来源的渠道进行分析,了解各个渠道的渠道效果;基于前端展示的用户行为分析,分析用户单击转化情况,优化前端页面展示。
3、RFM用户价值分析
这个案例主要是将用户以R(最近一次购买距现在时长)、F(购买频率)、M(消费金额)三个指标表示,通过规则定义或者聚类分析对用户进行分类以及周期价值分析,针对不同的用户客群采取不同的运营策略
4、用户流失分析与预测
本案例根据业务现状结合用户回访率定义流失用户和活跃用户,利用决策树模型预测用户流程可能性,输出流失用户名单,由运营人员重点运营,并对流失用户的特征进行定量分析,挖掘用户流程原因。
5、站内文章自动分类打标签
这是一个NLP案例,可能由于本书成书于两年前,当时BERT还未流行,不然此案例最优的解决方式就是BERT了。本书应用的方法是TF-IDF向量化文章,用朴素贝叶斯进行分类。
6、用户画像建模
这个一个比较大的案例,作者用一整章来进行案例分析。用户画像的本质就是为用户打标签,可分为三类标签:基于统计类的标签,如近七天消费次数、金额等,基于规则类的标签,如消费活跃用户定位为30天内消费两次以上等,基于挖掘类的标签,如通过对习惯行为的分析判断用户真实性别(淘宝将用户性别细分为20多个小类)等。用户画像具体可包括:用户人口属性画像,这里主要是用户在注册时填写的一些基本信息,年龄、城市、生日等;用户个性化标签,用户在产品上的浏览、搜索、关注、收藏、加购物车、付款、评价等行为带来的一系列标签,根据这些行为发生的时间、次数、行为类型进行标签建设;各业务线用户画像,根据各业务线特征设计标签监控用户在该业务线上的操作行为;用户偏好画像,在用户个性化标签的基础上,根据业务规则设定用户各类行为类型的权重、时间衰减方式、标签权重,并通过基于物品相关的协同过滤算法建立用户偏好画像;群体属性画像,用户分群主要用于冷启动阶段,新用户的商品推荐。