数据分析指标
数据指标定义
- 数据指标定义:
- 有价值、可统计
- 常用指标分类
- 用户数据 谁
- 行为数据 干了什么
- 业务数据 产生了什么结果
用户指标
- dau 日活用户数
- mau 月活用户数
- dnu 日新增 每天新增用户数
- 用户如何定义
- 点广告、下载、打开、注册
- 留存率
- 日留存— 计算单位是日 — 精细化
- 次日日留存 今日活跃用户中昨日注册的用户数/昨日注册用户数
- 7日日留存 第7日活跃用户中第一日注册的用户数/第一日注册用户数
- 算法1 第7天/第1天
- 算法2 第2天到第7天/第1天
- 算法3 第7天/第0天
- 30日日留存
- 周留存 -统计一周的数据
- 本周活跃用户中上周注册的用户数/上周注册用户数
- 月留存- 统计一月的数据 大盘
行为指标
- 数
- pv 访问次数
- uv 访问人数
- pv/uv 人均
- 访问深度
- 级别
- 没有级别,宽度代替深度 - 访问时长
- 最后一次访问时间-首次访问时间 - 弹出率、跳出率
- 基于单个页面
- 注意:只有一个页面 用时长来判定
业务相关
- 卖钱的产品
- gmv 销售总量—总共买了多少钱
- ARPU 人均收入金额
- ARPPU 付费人均收入
- 付费人数
- 付费率
- 付费频次
- sku:商品,道具 就是产品
- 不卖钱
- 目标完成量- 抖音 日均视频产生量1000w
- 人均访问时长
- 完成人数
- 完成率
- 社区类产品 获取用户时间为目的 优酷 抖音 知乎
- 用户访问总时长
- 平均用户访问时长
- 使用人数
- 使用频次
- 被消费内容: 视频,专栏,短视频
注意:如何定义上述指标,没有对错,只有达成一致: 数据口径一致 数据口径不一致会造成误会
数据指标详解
-
dau,mau
- 注意:mau在计算的时候一定要对整个月的数据进行去重(重复的用户只计算一次)
- 活跃定义:
- 基于事件上报
- 关键事件列表----防止漏掉数据
- 首页访问 详情页访问 抽奖页访问
- 维护成本 沟通成本
- 关键事件列表----防止漏掉数据
- 基于登录(登录2次)
- 打开app次数
- 基于事件上报
- 用户–怎么识别用户
- 认人
- uid
- 漏掉未登录的用户(可以通过随机uid存到cookie中来实现未登录用户识别)
- 认设备–不会漏掉未登录的用户的
- imei设备号
- 缺点:无法定位设备使用人(不排除恶心产品提出需求 摄像头识别)
- 通用的做法是看设备
- 认人
-
新增用户 dnu 留存率
- dnu 日新增
- 用户怎么定义 —真实用户一般是按照注册用户
- 但是要注意跟渠道相关的时候怎么算(算广告费怎么算)
- 留存
- 次留–次日留存 -以日为单位
- 公式: (前一天注册的用户中今天登陆的人数)/前一天注册的用户数
- 举例: 昨天新增注册用户1000个,然后今天这1000个人中有200个人登陆了 200/1000=0.2
- 七留— 七日留存 -以日为单位
- 算法1 第七天/第一天*100% 7日日留存
- 公式:(第七天登陆的人中是第一天注册的人数)/第一天注册的人数
- 举例:第一天注册了1000个用户,d2:500, d3:300, d4:250 ,d5:200 ,d6:150, d7:140
- 次留:0.5 7留:0.14
- 算法2 第二天~第七天去重/第一天*100% 7日内留存
- 公式:(d2-d7共6天登陆的人中是d1注册的人的个数)/第一天注册的人数
- 举例:第一天注册了1000个用户,d2:500, d3:300, d4:250 ,d5:200 ,d6:150, d7:140
- 次留:0.5 7留: >=0.5
- 算法3 第七天/第0天*100%——星期几是相同的 -分子和分母星期相同,可以避免周期波动带来的的影响
- 举例:第一天注册了1000个用户,d2:500, d3:300, d4:250 ,d5:200 ,d6:150, d7:140 d8:150
- 次留:0.5 7留: 0.15
- 举例:第一天注册了1000个用户,d2:500, d3:300, d4:250 ,d5:200 ,d6:150, d7:140 d8:150
- 举例: 周1:100,周2 120,周3:130,周四100,周五1000,周六1500,周日400
- 算法1 第七天/第一天*100% 7日日留存
- 30 日留 -以日为单位
- 公式:第一天注册的用户中第30天登陆的人数/第一天注册的人数
- 周留/月留 —以周/月为单位 —计算周期长 ,更稳定
- 公式:(上周/月注册的用户在本周/月登陆的人数)/上周/月注册的人数
- 留存指标的作用:
- 衡量渠道的质量
- 衡量产品本身的健康程度
- 次留–次日留存 -以日为单位
- dnu 日新增
-
行为指标
- 场景描述
- 10个用户来到了博学谷官网,访问了20次首页
- 20次首页访问中,有8次会点开课程详情页
- 最后有3个用户注册了会员
- 这3个人中有1个用户购买了课程
- pv 访问次数
- 首页pv=20
- 详情页pv=8
- uv 访问人数
- 首页uv=10
- 注册uv=3
- 付费uv=1
- pv/uv 人均访问次数 2次
- 转化率
- 首页-注册 注册uv/首页uv==0.3
- 注册-付费 付费uv/注册uv=0.33
- 首页-详情页 详情页pv/首页pv=0.4
- 访问深度
- 访问时长
- 弹出率
- 基于一次访问的
- 场景描述
-
业务指标
- GMV 销售额
- ARPU:GMV/用户数
- ARPPU:GMV/付费用户数
- 付费人数
- 付费率=付费用户数/用户数

选择指标
- 分析产品的业务模块—看业务模块的类型—根据类型选择指标
- 工具模块-效率
- 使用量
- 目标达成率
- 使用频次
- 交易模块- 转化率
- 详情页转化率
- 金额
- 客单价
- 复购率
- 内容浏览模块—内容的质量
- 浏览数
- 浏览广度
- 浏览时长
- 内容互动
- 社区模块
- 发布量—贴吧
- 互动量— 微博
- 关系密度—微信
数据分析方法
对比分析,多维拆解 漏斗分析, 分类分析 回归分析 异常分析 聚类分析
- 对比分析 —人比人气死人 比较才能看出问题
- 比什么
- 绝对值- 比量
- 比例值- 比变化情况
- 怎么比
- 环比 本期和上期比
- 同比 今年和去年同期比
- 和谁比
- 跟自己比
- 看自身情况
- 跟别人比
- 看大环境
- 跟自己比
- 比什么
- 多维拆解----分组对比
- 将数据按照某个维度分组进行对比分析/漏斗分析
- 定位问题/异常出现的原因
- 多维拆解能够分析出整体指标所不能表现的问题
- 漏斗分析——计算转化率
- 对于一个严格的路径流程转化率
- 适用:有明确的业务流程和业务目标
- 漏斗一定是有时间窗口的: 数据统计的时候要有一个固定时间段(天 周 月)
- 漏斗一定有严格顺序
- 漏斗计数单位可以基于用户也可以基于事件 人/次
- 踩坑:是否只有这一个漏斗能够到达最终目标
- 渠道质量评估—专题分析
- 通过某个指标来对渠道质量进行分析
- 指标不能太严格 导致渠道表现都不好
- 指标不能太容易 所有渠道都很好
- 不能只关注转化率,还要关注量
- 实际中是采用多个指标线性组合之后的一个得分来对渠道质量进行衡量
- 通过某个指标来对渠道质量进行分析
- 分布情况—多维拆解+对比分析
- 将数据分成多组(多维拆解),然后查看各组的数据分布情况(对比)
- 留存分析—专题分析
- 多维拆解
- 对比分析
- 拿不同维度的留存率跟大盘进行对比
工作流程
- 明确问题:知道问题的上下文
- 搭建框架:思考问题套路,一二三…
- 数据提取:Mysql hive为主
- 数据处理:Excel R python为主
- 数据分析:数据分析的常用套路
- 数据展示:Tableau excel R python
- 撰写报告:文笔功底,整体逻辑性
- 报告演讲:沟通,表达,报告之前有问题需要提前沟通
- 报告落地:最有含金量的部分
指标&业务逻辑-图
图片源自网络仅供个人查阅复习
商品运营指标

销售类指标

流量类指标

产品会员类指标

成本控制类指标

妥投类指标

站外推广&目标转化类指标

app运营数据体系

数据分析业务

异常数据分析

数据分析思维

会员异动指标
-
会员流失率
- 关注会员流失率的值
- 关注会员流失率的走向,上涨还是下降
-
会员异动比=新增会员数/流失会员数
-
会员数据化运营应用场景—精确营销
- 会员营销
- 会员关怀
会员数据分析模型
会员细分模型- 分群
将用户分群,然后做针对性的营销和服务
- 基于属性的方法
- ABC分类法
- 二八ace 帕累托图
- 聚类方法
- 二八ace 帕累托图
会员活跃度模型—RFE
-----基于不购买的产品
- 特征
- 最近一次访问时间R(Recency)会员最近一次访问或到达网站的时间
- 访问频率F(Frequency) 用户在特定时间周期内访问或到达的频率
- 页面互动度E(Engagements)互动度的定义可以根据不同企业的交互情况而定,例如可以定义为页面浏览量、下载量、视频播放次数等
- 后续的作用
- 基于分群对不同用户做精准营销
- 对分值进行求和计算得到一个分值,作为后续其他模型(会员流失预测模型)的重要特征
会员价值度模型—RFM
—基于交易的 --基于购买产品
- 特征
- 最近一次购买时间R(Recency)
- 购买频率F(Frequency)
- 购买金额M(Monetary)计算得出RFM得分
- 计算过程
- 选取时间截止点
- 提取截止点往前固定时间(一年)的数据
- 会员id、订单时间、订单金额
- 统计R/F/M值,都是连续数值
- 分档
- R越小档越高
- F,M越大档越高
- 处理方式
- 直接拼接,得到标签,313,322 分群
- 求和,得到一个分值
- 计算案例
- 加载数据
- 数据清洗
- 缺失值、异常值
- RFM统计运算
- 数据合并、数据分组计算
- RFM分档
- 方法:分位数、 专家给定、vi值、woe
- 后处理
- 直接拼接、加权求和
- RFM用户特征分析
- 三大类
- 占比10%以上 人多 低价值
- 广而告之 发短信 推送
- 占比1%-10% 人数中等 中价值
- 广而告之+人工
- 占比1%一下 人很少 高价值
- 人工 :上门、 电话、送礼
- 占比10%以上 人多 低价值
- 后期落地
- 根据公司运营情况,安排不同群体的排期
- 分值作为特征后续建模
- 三大类
- 注意问题
- 不同行业对R,F,M看重程度不一致
- 分箱的问题
- 四分位、专家(有经验)、 vi指标、woe指标
- 权重的问题
- 专家给出权重
- 模型给出权重 得有一个靠谱的标签y
会员流失预测模型— 分类算法 二分类
–预测会员是否流失
- 作用:
- 预测会员是否流失 — 机器学习
- 机器学习关注的是预测准,不关注可解释性
- 需要分割成训练集和测试集
- 找到流失用户的特征— 数据挖掘
- 数据挖掘关注的是可解释性,不去做预测
- 可以不分训练集合测试集
- 预测会员是否流失 — 机器学习
- 思路
- 问题:会员总量很大,没有是否流失的标签,现在我想知道哪些会员是流失的?流失的会员有什么特征?
- 人工抽样一部分数据,然后人工打标签
- 训练模型
- 用模型去预测剩下的,或者得到特征规则
- 模型:二分类 逻辑回归,随机森林
- 注意问题
- 流失用户是少数类,存在样本不平衡问题(类别不平衡)
- 输出的概率也有用,排名后分轻重缓急
- 得到流失用户的特征,圈选满足特征的用户进行挽回
- 模型要不断迭代,不能使用过久的历史数据训练模型
会员特征分析模型
—对会员特征进行分析 --分析特定用户的特征
- 模糊的规则— 得到的结果不是很明确,能做的事不多
- 聚类、统计分析
- 明确的规则— 算法
- 分类算法 看转化的用户有什么特征
- 关联分析 看有什么关联的规则
- 异常检测 防止黄牛党和羊毛党
营销响应预测模型—二分类/回归
— 广告营销 把钱花在20%人头上— 做实验再推广
- 作用
- 做实验,为营销活动提供数据支持
- 步骤
- 抽样用户,发送活动,记录数据
- 训练模型
- 特征:营销活动数据和用户本身数据 标签: 买 没买
- 二分类 逻辑回归 随机森林
- 后期处理
- 挖掘购买用户的特征,挑选满足特征的用户进行营销
- 基于预测得到估计的销量和营业额 为活动提供数据支持

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



