55、MINI算法:挖掘信息丰富且无冗余的项集

MINI算法:挖掘信息丰富且无冗余的项集

在数据挖掘领域,频繁项集挖掘是一个重要的研究主题。它有助于数据挖掘从业者在大型事务数据库中搜索强关联的项(和事务)。然而,频繁项集的数量通常非常庞大,对于人类用户来说难以管理。因此,近年来的研究致力于定义频繁项集的紧凑表示,例如闭频繁项集或最大频繁项集。但这些方法往往在充分减少输出大小方面仍存在不足,并且会输出许多冗余项集。本文提出了一种全新的方法——MINI算法,以解决这些问题。

1. 引言

频繁项集(或模式)挖掘自1993年提出以来,已经有数百种可扩展的方法被提出用于解决挖掘频繁项集的问题。但支持阈值设置不当会带来问题:过高的支持阈值可能只生成常识性模式甚至无模式;而挖掘低支持度的项集或处理高度相关的数据,则可能产生大量难以检查的结果。

为了解决这个问题,人们提出了多种方法来压缩(或总结)频繁项集,例如闭项集、非可推导项集、闭非可推导项集等,以找到整个模式集合的简洁表示。不过,这些项集的数量仍然可能很大,因此需要更复杂的技术来帮助用户更好地理解数据。

本文开发了一种新的基于概率和客观的有趣性度量方法,并提出了MINI算法,该算法能够发现数据中有趣且无冗余的见解。其新颖之处在于,有趣性度量的计算和冗余减少都是通过同时考虑项的领域和事务的领域来实现的。而且,MINI算法不需要用户手动选择任何参数,只需一个用于管理内存消耗而不影响结果质量的值。

2. 问题陈述
  • 事务数据库定义 :事务数据库$T = {t_i}_{i=1}^n$由一组具有唯一标识符的$n$个事务组成。设$I$是一组项${i_1, i_2, …, i_m}$。事务
复杂几何的多球近似MATLAB类及多球模型的比较 MATLAB类Approxi提供了一个框架,用于使用具有迭代缩放的聚集球体模型来近似解剖体积模型,以适应目标体积和模型比较。专为骨科、生物力学和计算几何应用而开发。 MATLAB class for multi-sphere approximation of complex geometries and comparison of multi-sphere models 主要特点: 球体模型生成 1.多球体模型生成:与Sihaeri的聚集球体算法的接口 2.音量缩放 基于体素的球体模型和参考几何体的交集。 迭代缩放球体模型以匹配目标体积。 3.模型比较:不同模型体素占用率的频率分析(多个评分指标) 4.几何分析:原始曲面模型和球体模型之间的顶点到最近邻距离映射(带颜色编码结果)。 如何使用: 1.代码结构:Approxi类可以集成到相应的主脚本中。代码的关键部分被提取到单独的函数中以供重用。 2.导入:将STL(或网格)导入MATLAB,并确保所需的函数,如DEM clusteredSphere(populateSpheres)和inpolyhedron,已添加到MATLAB路径中 3.生成多球体模型:使用DEM clusteredSphere方法从输入网格创建多球体模型 4.运行体积交点:计算多球体模型和参考几何体之间的基于体素的交点,并调整多球体模型以匹配目标体积 5.比较和可视化模型:比较多个多球体模型的体素频率,并计算多球体模型与原始表面模型之间的距离,以进行2D/3D可视化 使用案例: 骨科和生物力学体积建模 复杂结构的多球模型形状近似 基于体素拟合度量的模型选择 基于距离的患者特定几何形状和近似值分析 优点: 复杂几何的多球体模型 可扩展模型(基于体素)-自动调整到目标体积 可视化就绪输出(距离图)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值