
实时数仓3.0
文章平均质量分 96
实时数仓3.0
小坏讲微服务
熟悉各种微服务架构、一个菜鸟级别的后端小白、啥时候月薪过万呀、让你学习不在发愁的网站:https://www.e404e.cn
展开
-
数据仓库环境准备完整使用 (第四章)
DIM层数据源:kafka---topic_db(包含所有的业务表)过滤数据:过滤出所需要的维表数据过滤条件:在代码中给定十几张维表的表名问题:如果增加维表,需要修改代码-重新编译-打包-上传、重启任务优化1:不修改代码、只重启任务配置信息中保存需要的维表信息、配置信息只在程序启动的时候加载一次优化2:不修改代码、不只重启任务方向:让程序在启动的以后还可以获取配置信息中增加的内容具体实施:1) 定时任务:每隔一段时间加载一次配置信息将定时任务写在Open方法。原创 2022-12-21 11:08:26 · 1162 阅读 · 4 评论 -
数据仓库概述与建模完整使用 (第三章)
如果把数据看作图书馆里的书,我们希望看到它们在书架上分门别类地放置;如果把数据看作城市的建筑,我们希望城市规划布局合理;如果把数据看作电脑文件和文件夹,我们希望按照自己的习惯有很好的文件夹组织方式,而不是糟糕混乱的桌面,经常为找一个文件而不知所措。数据模型就是数据组织和存储方法,它强调从业务、数据存取和使用角度合理存储数据。只有将数据有序的组织和存储起来之后,数据才能得到高性能、低成本、高效率、高质量的使用。高性能:良好的数据模型能够帮助我们快速查询所需要的数据。原创 2022-12-14 16:41:26 · 1151 阅读 · 1 评论 -
数据仓库电商业务简介完整使用 (第二章)
电商的业务流程可以以一个普通用户的浏览足迹为例进行说明,用户点开电商首页开始浏览,可能会通过分类查询也可能通过全文搜索寻找自己中意的商品,这些商品无疑都是存储在后台的管理系统中的。当用户寻找到自己中意的商品,可能会想要购买,将商品添加到购物车后发现需要登录,登录后对商品进行结算,这时候购物车的管理和商品订单信息的生成都会对业务数据库产生影响,会生成相应的订单数据和支付数据。订单正式生成之后,还会对订单进行跟踪处理,直到订单全部完成。原创 2022-12-12 17:52:03 · 1083 阅读 · 0 评论 -
数据仓库概念完整使用 (第一章)
用户行为日志的内容,主要包括用户的各项行为信息以及行为所处的环境信息。收集这些信息的主要目的是优化产品和为各项分析统计指标提供数据支撑。收集这些信息的手段通常为埋点。目前主流的埋点方式,有代码埋点(前端/后端)、可视化埋点、全埋点等。代码埋点是通过调用埋点SDK函数,在需要埋点的业务逻辑功能位置调用接口,上报埋点数据。例如,我们对页面中的某个按钮埋点后,当这个按钮被点击时,可以在这个按钮对应的 OnClick 函数里面调用SDK提供的数据发送接口,来发送数据。可视化埋点。原创 2022-11-13 14:12:07 · 1323 阅读 · 0 评论