用户行为日志分析

用户行为日志生成渠道:

   Nginx,Ajax

记录用户访问行为日志的原因:

    网站页面的访问量

    网站的黏性

    推荐

用户行为日志内容:


1.访问的系统属性:操作系统,浏览器等等

2.访问特征:点击URL,从哪个url 跳转过来的(referer),跳转页面上停留时间

3.访问信息:session_id,访问ip(访问城市)


用户行为日志分析的意义:

离线数据处理架构:

  1.数据采集

      使用工具:flume工具

  2.数据清洗

    使用工具:Spark,Hive,MapReduce或者分布式计算框架

    清洗完之后的数据可以存放在HDFS中

   3.数据处理

     按照我们的需要进行相应业务的统计和分析

     使用工具:Spark,Hive,MapReduce或者分布式计算框架

   4.数据处理结果入库

     结果存在RDBMS,NoSql

   5.数据可视化展示

     使用工具:ECharts,HUE,Zeppelin

     通过图形化展示的方式展现出来:


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值