作者 | 橙子
审核 | gongyouliu
编辑 | auroral-L
数据盲点的价值
上期内容中和大家探讨了 “数据盲点的价值”,那么今天想和大家分享的是“阿里巴巴的大数据实践”。
按照我们通常的理解,一个人在注册某一网站的时候,性别登记只会是男性或女性。但不知你是否能想到,阿里巴巴竟有18个性别标签。在经过仔细调查后,我们发现了一些可以识别用户性别的方法。比如某个登记用户早上的浏览行为更男性一些,晚上就会变得更女性化(可能是妻子在使用)。真实的性别只有0与1的关系,而现实却是0~1的关系,或者70%是男性,30%是女性。在每一个场景内,性别的变化都确有其原因,例如搜索、社交和广告等。静态的“真实”性别在A/B测试中的表现不如动态的虚拟性别有效,这恰恰证明了数据是需要运营的, 绝不可以闭门造车.这样的例子在阿里巴巴不胜枚举。
谈到数据化运营,在公司内部我们是这样的流程:例如我们要为一个童装类目做营销推广以征集新用户,我们会先找到目标客户群,会把这个类目感兴趣的消费者用标签找出来,然后通过发邮件或者短信等方式来吸引他们的关注。这其实就是数据化运营,也就是用数据去帮助企业解决问题。最简单的解决办法是找出所有曾经看过 但没有购买的客户群,又或者利用关联类目去扩大目标客群。
而数据从“用”上升到 “养”,即运营数据,我们就会尝试在整个淘宝用户中查找。以针对12岁年龄之下儿童的商品为例,此时我们的做法就是在用户中搜索有多少用户家中有12岁以下的孩子,但却未发生过从这个类目购买商品的行为。你会发现,以前只能运营有过购买行为的几百万用户,现在我们的运营范围竟然可以达到几千万可能有12岁以下孩子的用户。从几百万到几千万,这就是运营数据,它是一个需要从主动收集数据到运营数据,再到产生新数据的过程。
从数据化运营到运营数据是不断运行的循环,在这样的循环中,会容纳许多新的、不同维度的数据,这些数据经过在整个循环中的适应过程,然后再运用到数据化运营中,并且改变原有的运营方式,这个过程被认为是大数据落地的方法。
数据化运营的前提是假定数据是稳定的,并且以此来改变企业的运营。但以前的数据都是结构化数据,比如说早期大部分企业都用财务数据来帮助企业运营,因为财务数据经过多年的沉淀,相对来说比较稳定。而自从非结构性数据或者半结构性数据产生以后,数据化运营的难度就变大了。我们做数据化运营,其前提是假定数据是稳定的,而运营数,则是假定数据都是可以获取的,而且是不稳定的。数据化运营需要和商业咬合的非常紧密,所以数据也是混合在商业里,以假定稳定的方法去做业务上的对比和细分及趋势预估的。这并不是说稳定是对的,而是因为企业对数据运营的分析是需要假设很多稳定因素的
本期的内容到这里就结束了,下期会继续和大家探讨“阿里巴巴的大数据实践(2)”。欢迎大家关注数据与智能获取更多好内容。
本文的视频版本可以直接点击下面视频观看,欢迎关注数据与智能视频号获取更多精彩视频。