数据挖掘相关主题与生物信息学应用
1. 相关数据挖掘主题概述
1.1 树数据挖掘
树数据挖掘适用于关注数据项(对象)之间层次交互的应用场景。例如,在 XML 数据分析、文本数据解析和分析等方面有着重要应用。通过树数据挖掘,可以深入理解数据之间的层次结构和关系,为进一步的数据分析和决策提供支持。
1.2 时间序列数据挖掘
当存在大量时间序列(或数据流)时,时间序列数据挖掘就发挥了重要作用。其目标是理解不同时间序列之间的关系,或者同一时间序列不同部分之间的关系。当时间序列仅由随时间变化的数值组成时,主要目标是把握趋势;而当时间序列由事件序列或复合对象组成时,则不仅要关注趋势,还要理解事件和对象之间的相互作用。
1.3 文本数据挖掘
从结构化数据的角度来看,文本数据具有句子级的顺序结构和段落/章节级的层次结构。文本数据挖掘历史悠久,至今仍是数据挖掘研究的热门领域。
1.4 事务性数据和关系数据
事务性数据和关系数据通常不被视为具有明显的结构,挖掘其底层项目之间的结构关系意义不大。
2. 部分周期性模式挖掘
2.1 周期性的概念
周期性可分为完全周期性和部分周期性。完全周期性指每个时间点都精确或近似地对时间序列的循环行为做出贡献;而部分周期性则是部分(不一定是全部)时间点对时间序列的循环行为有贡献。例如,Jim 每个工作日早上 7:00 到 7:30 会读《纽约时报》,但其他时间的活动规律性不强,这就是一个部分周期性的例子。部分周期性是一种比完全周期性更宽松的周期性,在现实世界中普遍存在。
超级会员免费看
订阅专栏 解锁全文
1680

被折叠的 条评论
为什么被折叠?



