86、高效发现大列时间数据库中的稳定周期模式

SPP-ECLAT算法挖掘列时间数据库稳定周期模式

高效发现大列时间数据库中的稳定周期模式

在大数据分析领域,从大型时间数据库中提取稳定的周期频繁模式是一项关键任务。传统上,相关研究主要集中在行时间数据库中发现这些模式,而忽略了在广泛用于存储大数据的列数据库中挖掘此类模式的可能性。本文提出了一种高效的算法——稳定周期频繁模式等价类转换(SPP - ECLAT),用于在列时间数据库中发现所需的模式。

1. 数据库类型概述

数据库根据数据在存储设备上的记录布局,大致可分为行数据库和列数据库两类:
- 行数据库 :以记录形式存储数据,将与一条记录相关的完整数据相邻存储在存储设备中。这类数据库主要基于ACID(原子性、一致性、隔离性和持久性)属性设计,旨在实现快速的行读写操作。常见的行数据库有MySQL和Postgres,它们更适合在线事务处理(OLTP)。
- 列数据库 :将数据按字段组织,把与一个字段对应的完整数据存储在同一存储设备中。列数据库主要基于BASE(基本可用性、软状态和最终一致性)属性设计,在列的读取和计算方面效率较高。例如Snowflake和BigQuery,常用于在线分析处理(OLAP)。

由于OLAP的主要目标是挖掘数据中的有意义信息,因此本文致力于在列数据库中发现稳定的周期频繁模式。

2. 周期频繁模式挖掘

周期频繁模式挖掘是一种重要的大数据分析技术,它需要识别所有满足用户指定的最小支持度(minSup)和最大周期(maxPer)约束的模式。
- 最小支持度(minSup) :约束模式在数据库中必须出现的最小事务数。
-

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值