维度建模培训随笔

数据仓库是从大的数据中获取一些宏观指标,为决策提供支持
报表,一个报表的作用是确定后期的工作, 明白事,分析事,
数据仓库是对系统建设的一种推动,可以发现原系统问题,规范各系统之间的数据定义及内容。
举例:
维度冗余,体系要一致,
原始底层维度就冗余,而很多地方新生成的数据是根据维度表间关系连接而得到,这样,可能造成
数据入口不同而数据不一致, 分析具体原因,数据仓库项目中,尽量确定统一入口进行统计。
数据仓库内部一致性,发现问题,分析问题,
数据编码尽量用户不可见。
从自身角度、个人所经历项目或目前所做的事情,认真分析概念内容。
认真分析系统中所涉及的维度表,确定其的组织形式、是否需要缓慢变化、层次、数据来源等内容。掌控数据。
重要:--事实表,表示维度多对多的关系。如果是多对一,则可以维度抽取出于另一维度中
忌讳:
套概念,
尽量不做更新操作,因为要考虑回退操作,很难实现
尽量采用流水的加减实现数据的统计
举例:
1,维度指标设计,如 一些标准值
建模尽量抛开业务,如 游戏种类和游戏,单一主键

维度过多,合种相关的维度进行抽像提出,事实表中只包含最细粒度维度,
注意:如两者之间虽然有联系,但随时会发生变化,可考虑事实表冗余此维度。  77页
代理关键字考虑  ,避免字段带有技巧性内容,,,为什么, 因为今天业务如此是技巧,明天就是垃圾
把一些非累加半累加转换成全累加型模型,(重要)
把一些多事务事实表,转化为单事务事实表。
周期快照,考验,每天一个余量 ,,比如,三月份公司员工有多少人,应该是一个时间点的人数,银行存款,,==
举例:录像,每帧为一个周期快照
业务环节的记录,事务快照,多数为更新,,
-----最后,数据仓库总线介绍,,矩阵法
             维度的一致性,,维度成员都是单独的,不存在相交情况
缓慢变化,对应几种情况
快速变化,采用维度追加于事实表中
数据难处理的是活跃的数据,分析活跃数据的生命周期,制定相应数据存储
--------------开篇:
先说一些常见的数据统计,单时间,跨时间(多业务环节)
事实表拆分考虑,统计维度是互折的,业务中不可能同时查询此两维度,
为每个业务主题保留最细粒度的维度模型
---------------
避免维度表中的主键有内在的含义         
操作型系统中的产品键都是有内在含义的
不要用生产系统中的键作为维度表的主键                     --不同意思,需要特定的转换,麻烦
反映历史时,同一键可能对应不同的实体
 
-----------------------------------------------------
个人一些建议:
对于底层事实表尽量使用事务事实表(少用更新操作)
避免字段技巧性设计
围绕业务流程构建维度模型
对于事实表中度量尽量考虑可全累加设计
事实表中代理主键的慎用
保证数据入口的一致性
事实表中尽量有且仅有单一的时间维
缓慢变化维及事实表冗余的设计权衡
事实规范化(把事实表中保留单个度量)慎用
维度建模理论体系较大,择其合适使用之
 

数据仓库采用使用维度建模的好处:易理解、查询的高性能、修改的灵活性和可扩充性。

维度建模是一个可不断扩充添加的过程

1)、在现有的事实表中增加维度。

2)、在事实表中增加事实。

3)、在维度表中增加属性。

在比较了解业务情况下,可先以底层细粒度构建开始,反之,以业务需求的粗粒度开始,至顶向下

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/134308/viewspace-761167/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/134308/viewspace-761167/

航拍图像多类别实例分割数据集 一、基础信息 • 数据集名称:航拍图像多类别实例分割数据集 • 图片数量: 训练集:1283张图片 验证集:416张图片 总计:1699张航拍图片 • 训练集:1283张图片 • 验证集:416张图片 • 总计:1699张航拍图片 • 分类类别: 桥梁(Bridge) 田径场(GroundTrackField) 港口(Harbor) 直升机(Helicopter) 大型车辆(LargeVehicle) 环岛(Roundabout) 小型车辆(SmallVehicle) 足球场(Soccerballfield) 游泳池(Swimmingpool) 棒球场(baseballdiamond) 篮球场(basketballcourt) 飞机(plane) 船只(ship) 储罐(storagetank) 网球场(tennis_court) • 桥梁(Bridge) • 田径场(GroundTrackField) • 港口(Harbor) • 直升机(Helicopter) • 大型车辆(LargeVehicle) • 环岛(Roundabout) • 小型车辆(SmallVehicle) • 足球场(Soccerballfield) • 游泳池(Swimmingpool) • 棒球场(baseballdiamond) • 篮球场(basketballcourt) • 飞机(plane) • 船只(ship) • 储罐(storagetank) • 网球场(tennis_court) • 标注格式:YOLO格式,包含实例分割的多边形坐标,适用于实例分割任务。 • 数据格式:航拍图像数据。 二、适用场景 • 航拍图像分析系统开发:数据集支持实例分割任务,帮助构建能够自动识别和分割航拍图像中各种物体的AI模型,用于地理信息系统、环境监测等。 • 城市
内容概要:本文详细介绍了一个基于YOLO系列模型(YOLOv5/YOLOv8/YOLOv10)的车祸检测与事故报警系统的设计与实现,适用于毕业设计项目。文章从项目背景出发,阐述了传统人工监控的局限性和智能车祸检测的社会价值,随后对比分析了YOLO不同版本的特点,指导读者根据需求选择合适的模型。接着,系统明确了核心功能目标,包括车祸识别、实时报警、多场景适配和可视化界面开发。在技术实现部分,文章讲解了数据集获取与标注方法、数据增强策略、模型训练与评估流程,并提供了完整的代码示例,涵盖环境搭建、训练指令、推理测试以及基于Tkinter的图形界面开发,实现了视频加载、实时检测与弹窗报警功能。最后,文章总结了项目的全流程实践意义,并展望了未来在智慧城市、车联网等方向的扩展潜力。; 适合人群:计算机相关专业本科毕业生,具备一定Python编程基础和机器学习基础知识,正在进行毕业设计的学生;; 使用场景及目标:①完成一个具有实际社会价值的毕设项目,展示从数据处理到模型部署的全流程能力;②掌握YOLO目标检测模型的应用与优化技巧;③开发具备实时检测与报警功能的交通监控系统,用于答辩演示或科研展示; 阅读建议:建议按照“背景—数据—模型—界面—总结”的顺序逐步实践,结合提供的代码链接进行动手操作,在训练模型时注意调整参数以适应本地硬件条件,同时可在基础上拓展更多功能如短信报警、多摄像头接入等以提升项目创新性。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值