数据仓库概念
(1)公司搭建数仓的目的
- 存储公司的数据,通过对这些数据进行提炼和分析,来为企业制定决策
- 可以帮助企业,改进业务流程、提高产品质量等
- 简而言之,就是为公司的战略做数据支撑
(2)数仓的主要工作
- 存储
存储公司海量数据 - 计算
就是SQL - 分析
通过对数据清洗、计算,最后形成报表,给老板看
(3)数仓的数据来源
(3.1) 业务数据
就是各行业在处理事务过程中产生的数据。比如用户在电商网站中登录、下单、支付等过程中,需要和网站后台数据库进行增删改查交互,产生的数据就是业务数据。业务数据通常存储在MySQL、Oracle等数据库中
(3.2)用户行为数据
用户在使用产品过程中,通过前端埋点收集与客户端产品交互过程中产生的数据,并发往日志服务器进行保存。比如页面浏览、点击、停留、评论、点赞、收藏等。用户行为数据通常存储在日志文件中