- 博客(6)
- 收藏
- 关注
原创 评价指标
AUC统计意义从所有正样本随机抽取一个正样本,从所有负样本随机抽取一个负样本,当前score使得正样本排在负样本前面的概率。正样本排在负样本前面占样本对数的比例,即这个概率值。反应的是模型对样本的排序能力实现逻辑首先对prob score从大到小排序,令最大prob score对应的sample 的rank为n,第二大score对应sample的rank为n-1,以此类推。把所有的正类样本的rank相加,再减去M-1种两个正样本组合的情况。得到所有样本中有多少对正类样本的score大
2020-10-10 21:53:09
228
原创 政企用户离网预警
流失去向• 外部——客户关闭或减少了在当前机构的业务而转向了其它竞争对手;• 内部——客户关闭或减少了在当前机构的部分业务而转向了当前机构的其它业务。针对流失的目标定义,锁定一批用户,观察其在后续业务使用中持续沉默天数,滚动考察用户持续沉默环比。当用户在该业务持续沉默天数超过两周后,持续沉默环比高于X%且后续趋势平稳。因此我们将本次该业务流失分析的目标定义为:用户该业务使用出现连续沉默14天及以上。基于该定义着手构建建模分析样本。根据SEMMA的数据挖掘方法论,建模分析过程主要包括抽样(Samp.
2020-07-10 09:38:15
304
原创 用户流失预警
用户流失预警用户流失预警What三级目录WhyHow数据集流失标签流失标签标注整体流失率各维度流失率IDC业务数据特征数据字段流失用户特征用户画像指标人口统计指标用户活跃度消费产品指标短号码详单-账单IDC业务消费信息指标收入指标行业结构指标用户流失预警What三级目录Why用户流失率降低5%,公司利润将提升25%-85%。增加用户黏性,延长用户生命周期How数据集流失标签流失标签标注整体流失率各维度流失率IDC业务数据特征数据字段#### 数据特征流失用户特征用户画像指
2020-07-10 09:37:57
621
原创 经营分析指标
电信运营商的经营分析是通过对经营数据的分析研究,评价企业的经营现状成效和预估企业的市场发展趋势。用户数据指标行为数据指标 产品数据指标产品业务案例1、【一次性交易产品业务】类比:阿里天池-婴儿产品数据(1)理解数据用户数据:user_id、birthday、gender行为数据:day、buy_amount、auction_id(购买物品唯一)产品数据:cat_id、cat1、property(2)业务指标用户数据指标:【日新增用户数】user_id、day可以查看每日新增
2020-07-09 18:43:14
2864
原创 Idea-Git环境管理
Idea-Git环境管理Idea-Git环境管理代码仓库及开发环境Idea环境配置Git RemoteIdea-Git环境管理本文实现功能为Idea-Git环境管理。批量抓取、服务间调用与存储。记录原理与实战中的踩雷填坑。代码仓库及开发环境我们用GitLab数仓管理,用Idea开发环境做分值切换。期间注意事项如下:远程仓库 :GitLab远程仓库;分支切换: Idea中远程与本...
2020-04-24 17:17:08
402
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人