一个母婴电子商务网站贝贝网的大数据平台及机器学习实践
关键字:大数据平台、机器学习
贝贝网的主要产品是垂直的母婴类,母婴相对一般的电子商务网站有一些特点:第一个特点是商品周期短,在母婴网站上的商品,在线的时间不会超过5-7天,第二个是用户需求的变化快,在母婴行业,可能是用户的需求变化最快的领域,比如是用户处在怀孕当中,关心的是孕妈的一些问题,几个月以后,随着宝宝的落地,就会准备一些纸尿裤和奶粉,而且随着宝宝的长大,纸尿裤和奶粉的类型也会变化。第三个是移动化,一般有90%的成交是来自移动端的。
手机端的屏幕非常的小,可以给客户的信息非常的有限,所以需要我们帮助用户找他有兴趣的东西,大数据平台既要为网站的活动提供大数据的支撑,还需要实现个性化的推荐,搜集用户的行为,全面的了解用户的购物意图,推荐用户感兴趣的商品。
下图是整个大数据平台的架构图,最下面的是我们的数据收集,后面会有介绍。计算层包括了离线计算和实时计算,以后搜索引擎,在算法层有协同过滤,分类产生一些用品的商品特征,以后排序的模型。在业务层的话,业务的类型是丰富多彩的,我们会融入一些运营的规则进行调整,包括一些个性化的调整和推荐,以及营销。
BI层的应用有面向运营的,面向商家的,会涉及用户的浏览日志,在PC上的一些行为,比如是用户浏览了一些什么商品,点击了一些什么商品,对数据的消费也有二种方式,一种是实时消费,一种是离线消费,这种方式会在每天的凌晨进行一次统计,会有一天的延时,比如是 今天上线的活动,可能明天才知道这个活动的效果,因为我们研发了一套实时的数据研发系统,因此任何需要实时消费的数据报告,只要订阅就可以了。
<