数仓 DW层中主题表之页面交互事件概况主题(分享,点赞,收藏)
1. 背景
- 在大数据开发中,本身的数据处理分析目的一般就是2类,一个是基于现有数据找出规律,做总结和分类统计。一个是基于现有数据找出规律,然后训练出模型,最后预测未来变化。
- 前者就是传统的大数据分析和处理
- 后者就是近几年火起来的机器学习
- 大数据处理中,数据来源一般是三大类,爬虫数据,行为日志埋点数据,业务数据。当然特殊场合还会有购买来的线程数据。
- 行为日志数据中,顾名思义,一般就是对用户行为记录的数据,由于目前都是互联网迭代敏捷开发,一个功能出现后,并不能很好确定对业务和业绩带来的变化是正面还是负面,以及影响程度。这时候就可以从行为日志中对一些基本指标做统计,从侧面来评估一个功能或者页面,或者流程对现有用户和业务业绩的影响。
- 赞,转,踩,收藏,很常见的四个指标,互联网需求开发中会经常遇到。本文就是解析基于行为日志数据对这几个指标做统计分析
2. 分享
- 分享的行为日志模拟数据
{"account":"","appId":"cn.doitedu.app1","appVersion":"3.4","carrier":"中国移动","deviceId":"8QEmr7ljihxQ","deviceType":"GALAXY-2","eventId":"share","ip":"237.104.179.108","latitude":26.48286080225125,"longitude":106.05814604570286,"netType":"3G","osName":"android","osVersion":"6.5","properties":{"pageId":"301","productId":"888"

本文聚焦于大数据仓库DW层中的页面交互事件,特别是分享、点赞和收藏行为的统计分析。通过对行为日志数据的处理,揭示这些指标如何反映用户行为对业务和业绩的影响。分享部分涉及分享次数、分享人数、时段、设备类型和分享平台等关键指标;点赞和收藏的分析思路与分享相似,都是通过日志数据进行统计以评估功能效果。
最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



