用户行为日志生成渠道:
Nginx,Ajax
记录用户访问行为日志的原因:
网站页面的访问量
网站的黏性
推荐
用户行为日志内容:
1.访问的系统属性:操作系统,浏览器等等
2.访问特征:点击URL,从哪个url 跳转过来的(referer),跳转页面上停留时间
3.访问信息:session_id,访问ip(访问城市)
用户行为日志分析的意义:
离线数据处理架构:
1.数据采集
使用工具:flume工具
2.数据清洗
使用工具:Spark,Hive,MapReduce或者分布式计算框架
清洗完之后的数据可以存放在HDFS中
3.数据处理
按照我们的需要进行相应业务的统计和分析
使用工具:Spark,Hive,MapReduce或者分布式计算框架
4.数据处理结果入库
结果存在RDBMS,NoSql
5.数据可视化展示
使用工具:ECharts,HUE,Zeppelin
通过图形化展示的方式展现出来: