
日志采集
蚂蚁大哥大
这里不需要签名
展开
-
用户实时行为数据采集
用户实时行为采集数据流转如下: 1.web、wap通过埋点实时发送用户行为数据至后端server, app直接调用http接口,server通过logback直接输出日志文件 2.flume通过tail命令监控日志文件变化 3.flume通过生产者消费者模式将tail收集到日志推送至kafka集群 4.kafka根据服务分配topic,一个topic可以分配多个group,一个group可以原创 2016-07-21 11:32:06 · 4513 阅读 · 1 评论 -
基于spark-streaming实时推荐系统(一)
前言 随着互联网的飞速发展,如何能够让用户在广袤的互联网中获取到他所想要的,这时候人们有了搜索引擎。搜索引擎好比一个仓库,它需要事先储藏大量的资源,你需要什么都可以从中获取得到。这种被动索取的方式无形之中也注定了搜索引擎在某个范围内只能一家独大。科技改变着人们的生活,随着大数据时代的到来,传统被动等候来获取的方式由于其需要的前期投入较大,准确性往往也不能满足用户的真正需求,在此背景之下,推荐引擎遍广原创 2016-11-03 20:48:37 · 13087 阅读 · 0 评论 -
基于spark-streaming实时推荐系统(三)
当博主在写 基于spark-streaming实时推荐系统(一), 基于spark-streaming实时推荐系统( 二)时,心里还曾暗自窃喜:“五年多推荐系统设计研发工作,再搭一套推荐系统还不是轻松的事么!”。只有真正做了之后才知道这其中的辛酸与血泪。 首先博主前期的推荐系统经验主要是基于传统电商网站,推荐的主体是用户,推荐的内容是商品。商品只要能够满足销售的基本要素便一直是众原创 2016-12-17 15:30:11 · 12003 阅读 · 3 评论