42、数据挖掘中的查询技术与归纳数据库框架

最新推荐文章于 2025-12-02 15:51:34 发布

julia4scientist

最新推荐文章于 2025-12-02 15:51:34 发布

阅读量17

点赞数

CC 4.0 BY-SA版权

分类专栏：数据仓库与知识发现探秘文章标签：数据挖掘 SQL查询归纳数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/julia4scientist/article/details/154420929

数据仓库与知识发现探秘专栏收录该内容

56 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

数据挖掘中的查询技术与归纳数据库框架

1. 数据挖掘查询面临的挑战与新方法

在数据处理领域，数据挖掘（KDD）给数据库技术带来了新的挑战，需要新的概念和方法来构建通用查询语言。传统上，在不同系统间移植代码是一项艰巨的任务，需要借助专门的“黑盒”程序。广义关联规则挖掘这类复杂的挖掘任务，以往也依赖于专门的程序。

目前已知的用于广义关联规则数据挖掘的纯 SQL - 92 查询仅有 ST - SQL 一种。不过，研究人员提出了两种新的 SQL 查询：TTR - SQL（利用临时关系）和 TH - SQL（结合了之前两种查询的优点，如候选剪枝）。

对这三种查询进行评估后发现，新提出的查询在四轮数据挖掘中性能提升可达 30%，且随着轮数增加，性能有望进一步提升。分析表明，ST - SQL 在第 k 轮的执行时间至少与 k 倍的事务数据大小成正比，这导致其在三轮以上的性能较差。

PC 集群因其高性价比，是并行关系数据库管理系统（RDBMS）的理想平台。与用 C 语言编写的原生数据挖掘程序进行性能比较后发现，10 到 15 个节点就足以达到专门程序的性能。

2. 归纳数据库的概念与结构

归纳数据库为解决数据挖掘中的查询问题提供了新的思路。其模式是一个二元组 R = (R, (Q _R , e, V))，其中：
- R 是数据库模式。
- Q _R 是模式集合。
- V 是结果值集合。
- e 是评估函数，它将每对 (r, θ _i ) 映射到 V 中的一个元素，这里 r 是基于 R 的数据库，θ _i

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。