specification连表查询需要有外键关联码_性能优化技巧:外键序号化

本文详细介绍了如何通过外键序号化技术提升数据库查询性能。首先,阐述了序号化的背景和适用场景,然后展示了在SPL中实现维表和事实表序号化的具体步骤。通过对比实验,证实了序号化后查询时间显著减少,性能提升明显。最后,讨论了序号化字段的要求以及如何处理新增数据的情况。

一、 问题背景与适用场景

在《性能优化技巧:部分预关联》一文中,我们介绍了将维表内存化并预关联的技术,但事实表与维表关联时,仍需进行hash计算和比对,怎么提高这一步的性能呢?我们今天再介绍一种优化技巧:外键序号化。

外键序号化的思路是,如果维表的主键是从1开始的自然数(也就是记录所在行号),那么就可以用键值直接按行号定位维表记录,而不再需要计算和比对HASH值了,从而加快与维表关联的速度,进一步提升性能。而且,直接用序号定位,还不需要建立索引,占用内存也会小很多。

我们下面来介绍如何在SPL中使用外键序号化技巧,并使用上文的测试环境,针对同一个查询问题,以序号化后的数据与之前的数据做对照实验,验证序号化的性能提升效果。

二、 序号化准备

要使用外键序号化技巧,必须要保证维表的主键值正好是序号(记录行号),而实际业务中维表的主键值往往不是这样,所以要先将维表的主键转换成序号。转换的方法如下:

1)新建一个键值-序号对应表,保存维表的键值和自然序号的对应关系;

2)把维表的键值替换为自然序号,得到一个新的维表文件;

3)把事实表里的外键值修改为序号,修改的依据是键值-序号对应表,修改后得到一个新的事实表。

本次实验要用到的三张维表分别是supplier、part与orders,事实表是lineitem,下面分别对它们实现序号化。

1. supplier序号化

实现序号化的SPL脚本如下:

3b97f9ab84a9caae01008ec3134c540e.png

A1 从原始数据文件supplier.tbl中读出数据,并用derive函数新增加一列xh,用行号作为字段值

A2 将A1中的S_SUPPKEY、xh两字段输出到集文件supplier_xh_key.btx中,生成键值与序号对应关系表,以备序号化事实表时使用

A3 以xh字段值代替S_SUPPKEY字段,重构supplier序表

A4 创建序号化后的组表文件supplier_xh.ctx

A5 将重构后的supplier序表保存到组表文件supplier_xh.ctx中

2. part序号化

实现序号化的SPL脚本如下:

d93cb58b1d54551d03d8e94509f00f82.png

脚本原理与supplier表序号化相同,生成的键值与序号对应关系表为part_xh_key.btx,序号化后的组表文件叫part_xh.ctx。

3. orders序号化

实现序号化的SPL脚本如下:

a40bf59fc7ba9eddb47aca3e648a967a.png

脚本原理与supplier表序号化相同,生成的键值与序号对应关系表为orders_xh_key.btx,序号化后的组表文件叫orders_xh.ctx。

4. lineitem序号化

实现序号化的SPL脚本如下:

73ad67e4e9e6b9a70aa94663d7dcd853.png

A1 创建读入lineitem原始数据的游标

A2/A3/A4 分别读入orders、part、supplier键值与序号对应关系表

A5 用L_ORDERKEY与orders对应关系表关联,用L_PARTKEY与part对应关系表关联,用L_SUPPKEY与supplier对应关系表关联

A6 用关联后的序号值替换键值生成新的游标

A7 创建序号化后的组表文件lineitem_xh.ctx

A8 将序号化后的游标数据写入组表lineitem_xh.ctx

三、 序号化测试

1. 原始数据测试

维表预加载SPL脚本如下:

d4d42f5d8ebdd8937983346e9a156ef9.png

加载维表并建索引。

编写SPL测试脚本如下:

ea25142a37947810dad3c5dbf69e2772.png

先运行维表预加载脚本,再运行测试脚本,得到测试脚本运行时间为450秒。

2. 序号化数据测试

维表预加载SPL脚本如下:

cb497a6414b3e902105c484d95e5f692.png

加载的是序号化后的维表,不需要建立索引。

编写SPL测试脚本如下:

82efb5f4f620d38f4024a5cdbb056c02.png

注意:A2中关联时使用“:#”与维表关联,表示用事实表中的键值与维表的行号进行关联,假如键值是7,则直接与维表的第7行关联。

先运行维表预加载脚本,再运行测试脚本,得到测试脚本运行时间为269秒。

3. 分析与结论

在上面两组对照实验中,序号化后的数据与序号化前相比,维表的记录数、字段数完全相同,事实表的记录数与字段数也完全相同,仅有相关的键值换成了序号。查询过程相比,过滤条件完全相同,过滤后的参与计算的数据完全相同,也就是说过滤与分组求和所用的时间完全相同,所不同的仅有关联的方式(行号关联、键值的hash值比对关联),而运行时间减少了450-269=181秒,可见,外键序号化对性能提升效果十分显著。

四、 进一步说明

序号化的字段必须是维表的主键,但不限主键字段的数据类型,整数、字符串、日期、时间等等都可以序号化。对于多主键维表,可以新增一个序号字段,建立多个键值与序号的对应关系表,并依此对事实表进行序号化。

一般来说,外键序号化技巧可以很方便地适用于历史数据的查询,只需对历史数据进行一次序号化就可以使用了,键值与序号对应关系表也无须再保留。

但外键序号化技巧同样适用于有新增数据的查询,只是会多增加些步骤。

1. 维表与事实表均有新增数据

1)先取得维表新增加的记录,追加键值与序号对应关系表;

2)再把新增记录追加到序号化后的维表,追加时依据键值与序号对应关系表;

3)再把事实表新增加的记录追加到序号化后的事实表,追加时依据键值与序号对应关系表;

2. 仅事实表有新增数据

在维表数据保持不变的情况下,仅需进行上述第3)步即可。

处理好新增数据以后,就可以使用外键序号化关联查询技巧了。

python+Pyside6+MySQL使用UTF-8编,做一个小型阀门厂的生产物料管理系统,实现订单管理、生产管理、协管理、库存管理、采购管理。 一、产品及物料介绍 1、产品:阀门、减温器。 ①、阀门:由三部分组成整机:阀门本体、驱动(电动、气动)、附件,同时还会按照合同提供配套件、备品备件等。 本体:由总装配图提供阀门本体的结构和明细,也可以说是提供了结构零件BOM,具体的材质还是需要根据订单的工况要求确定。这就出现了同一张图纸因采用不同材质的原材料成为不同零件,其中的标准件亦是如此。 ②、驱动:有电动执行器、气缸执行器、薄膜头执行器。 电动执行器主要采。 气缸执行器自制,由总装图和单件图 薄膜头执行器自制,由总装图和单件图。 ③、附件:控制执行器的动作,基本采。 ④、减温器:由总装图和单件图,同样涉及同一张图不同材质问题。 2、原材料: ①、材料形式:棒料、板料、管料、锻件、铸件、扁钢等 ①、常用材质:20#、45#、410、20Cr13、304、WCB、WCC、WC9、F22、F91等 3、紧固件 4、密封件:有部分是标准件用B识别,有部分是定制采件成为购件,用WG识别 二、工作流程 1、订单明细:由销售工程师根据合同和客户沟通确定。是订单包含的具体货物的列,注明了每项货物的型号、位号、系列号、产品规格、材质、阀内件结构、阀内件材质、驱动方式、执行器型号、Cv值、泄漏等级、附件(可单独列)、备品备件(单独列)等。 2、技术工程师依据订单明细,进行详细设计,确定阀门本体的结构和每个零件的材质,生成相应图纸和材料即BOM。 3、生产部依据图纸和材料,规划零件的用料、工艺路线,对照库存确定投料,通过现品票的形式下达投料指令,现品票状态在产。同时将原材料采购清单提供给采购部。 4、采购部根据原材料采购清单对采购,同时将采购进度在收货记录中记录并根据采购进度。 5、质检部依据收货记录对进厂货物检验,并按照有关要求复检。合格货物由质检员填写入库单。 6、库管员根据入库单办理入库手续。 7、车间按照现品票领料、下料、加工。 8、质检员依据图纸进行过程检验。 9、加工完成的零件,办理入库,现品票完成。 10、库管员按照材料备料完成后通知车间钳工组。 11、车间钳工组依据总装图装配、测试。 12、质检员检查测试合格 13、包装 14、发货 三、补充 1、原材料的基本信息:编、名称、图纸/标准、规格、材料形式等 2、产成品及零件的基本信息:编、名称、图纸、规格尺寸、材质等。这一部分,有几个要注意的问题:产品、部件、零件之间的关系,产品是整机,由本体、执行器、附件构成,其本体、执行器属于由零件装配成的部件;附件是零件依据材料(BOM)组装到执行器上,控制执行器的一组元器件、零件的组合。 本体、执行器有自身的设计参数。本体的主要参数有口径、磅级、材质、阀内件结构、阀内件材质、阀体材料形式、联接方式(BW、RF等)、CV值、泄漏等级、介质、温度等。执行器参数有驱动方式(电、气等)、结构(气缸、薄膜头等)、行程、运动方式、推力、电压、气源压力等 3、现品票基本信息:现品票号、零件编、图纸、规格尺寸、材质、生产量、原材料编、图纸/标准规格、材质、材料定额、工艺路线、订单、产品规格、系列号、投料日期等 4、预留订单明细、材料的Excel导入接口,日后完善。 5、订单分为订单、订单明细。订单号结构举例:HM2025-065 ,HM订单类别,2025年份,065指当年的订单顺序号;型号举例:6B-2500LB,示6英寸口径,压力2500磅的阀门;系列号举例2025-065Z1256,Z后面的数字示生产的数序号。Z示自制,W采,SH售后,SHZ示原订单的系列号的售后,BJZ示这个系列号的备件,多指本体、驱动等部件,BPZ示这个系列号的备品备件,多指阀内件中的易损件。 6、订单号、系列号是来的需要手动输入。现品票号要系统按照顺序生成,可以说用HP开头,如HP000001 。 7、常用材质:304、20Cr13、F22、F91、WCB、WC9、603、45#、20#、Q235A、718等。关于阀门型号也许成为阀门规格更适合:3B-150LB、3B-300LB、3B-600LB、3B-1500LB、3B-2500LB、4B-150LB、4B-300LB、4B-600LB、4B-1500LB、4B-2500LB、6B-150LB、6B-300LB、6B-600LB、6B-1500LB、6B-2500LB、8B-150LB、8B-300LB、8B-600LB、8B-1500LB、8B-2500LB、10B-150LB、10B-300LB、10B-600LB、10B-1500LB、10B-2500LB等 8、订单管理采用树形结构,左侧显示树结构,主干每个订单号加客户关字,下一层是订单包含的数项订单明细,订单明细显示系列号非订单号部分加上阀门规格,在树形结构框上方设置订单状态组合框选项:在产、入库、发货,默认在产,选择其他选项,树形结构会重新筛选;右侧分成上下两部分,上部显示订单信息,下部显示订单明细的信息,上下两部分分别设置编辑保存按钮,独立编辑。在合适位置设置订单导入按钮备用,后续会完善订单信息导入,是从Excel中导入的。 树形结构的主干应该是订单号(HM开头),下一层是订单明细(显示系列号和阀门规格)。需要特别注意系列号的格式验证,之前已经设计过正则达式。 9、主界面放置仪盘,显示生产状态的数据
12-08
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值