数据挖掘中的模式发现、概率建模与高效多方法调度
数据挖掘中的模式发现与概率建模
数据挖掘近年来成为算法、概率建模、统计学和数据库交叉领域的一个有趣研究方向。数据挖掘研究主要源于两种不同的传统方法:
- 全局方法 :旨在对数据的联合分布进行建模。在全局建模技术中,混合模型已成为一个强大的统一主题,并且存在适用于在大型数据集上拟合此类模型的方法。
- 局部方法 :致力于从数据中高效地发现频繁模式。用于查找频繁出现的正合取的方法已在各个领域得到应用。
一个有趣的开放性问题是如何将这两种方法结合起来,例如通过从模式频率推断联合分布。使用最大熵方法已经取得了一些有前景的成果。
面向对象语言中的多方法调度问题
在面向对象语言中,调度问题是指在运行时确定要调用的最专门化方法。这对于执行性能来说是一个关键因素。
目前,大多数商业面向对象语言依赖于单参数方法的调度,即单方法或一元调度问题。已有许多研究针对一元调度问题,如Ferragina和Muthukrishnan提供了一种线性空间的数据结构,支持以对数 - 对数时间进行一元调度。
然而,更通用的多方法调度问题(使用多个方法参数进行调度)则面临不同的挑战。多方法调度已被认为是支持多方法的面向对象语言(如Cecil、CLOS和Dylan)中的一个强大特性。
近期有一些研究尝试解决d元调度问题。Ferragina等人提供了第一个非平凡的数据结构,并且指出一些实验性面向对象语言的最终成功和实际影响在很大程度上取决于多方法调度能否得到高效支持。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



