32、数据挖掘与仓库性能优化：并行算法与自主系统的应用

最新推荐文章于 2025-12-23 18:08:53 发布

echo99

最新推荐文章于 2025-12-23 18:08:53 发布

阅读量36

点赞数

CC 4.0 BY-SA版权

分类专栏：探索KES 2009：智能信息与工程系统前沿文章标签：数据挖掘数据仓库优化并行算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/echo99/article/details/149375629

探索KES 2009：智能信息与工程系统前沿专栏收录该内容

45 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

数据挖掘与仓库性能优化：并行算法与自主系统的应用

在当今信息爆炸的时代，数据挖掘和数据仓库性能优化变得至关重要。本文将介绍两种不同但相关的技术：并行挖掘高实用项集的方法以及基于本体的自主系统来提升数据仓库性能。

并行挖掘高实用项集

在分布式数据库环境中，挖掘高实用项集（HUIs）是一项具有挑战性的任务。为了解决这个问题，提出了一种并行方法和高效算法。

数据表格与值

首先，有客观值表和主观值表，如下所示：
| | D | E |
| — | — | — |
| T1 | 0 | 1 |
| T2 | 2 | 1 |
| T3 | 0 | 1 |
| T4 | 2 | 1 |
| T5 | 0 | 2 |
| T7 | 2 | 1 |
| T8 | 6 | 1 |
| T10 | 0 | 2 |

同时，每个项目有对应的效益值：
| Item | Benefit |
| — | — |
| D | 3 |
| E | 5 |

DTWU - Mining 算法

由于本地 HUIs 从所有从站点（SlaverSites）挖掘并发送到主站点（MasterSite），主站点仅挖掘其项集至少出现在两个从站点的 HUIs。因此，需要对 TWU - Mining 进行扩展。
- 当从站点向主站点发送信息时，添加第 4 个字段，即指示包含该项的从站点的组。
- 在第 1 层连接 2 个顶点时，仅检查它们是否属于同一组。从第 2 层开始，DTWU - Mini

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。