数据挖掘新方法:从购物行为到农业贸易数据分析
在当今的数据驱动时代,数据挖掘技术在各个领域都发挥着至关重要的作用。无论是分析消费者的购物行为,还是挖掘农业贸易数据中的潜在信息,都需要高效准确的算法和方法。本文将介绍两种不同但同样重要的数据挖掘方法,一种用于提取非冗余的相关购买行为模式,另一种则用于检测农业贸易数据中的特征交互。
提取非冗余相关购买行为模式
在传统的网络搜索和数据挖掘中,以往的研究在实际应用中存在一些局限性。传统方法所挖掘出的模式往往有限,因为它们很少考虑到模式中固有的效用因素和相关性。为了解决这个问题,提出了一种名为CoHUIM的高效挖掘算法。
CoHUIM算法同时考虑了传统的效用度量和模式内项目的固有相关性。它采用了基于投影的方法,通过扩展候选子投影数据库来挖掘相关高效用项集(CoHUIs),从而逐步减少搜索空间和内存使用。为了保证CoHUIs的全局反单调性并有效修剪搜索空间,还提出了一种新颖的排序向下闭合属性。
实验表明,CoHUIM算法在生成模式和执行时间方面都优于现有的FDHUP算法。而且,所得到的CoHUIs数量比高效用项集(HUIs)少,但更有价值和趣味性,避免了大量冗余和无意义的信息。
minCor在CoHUIM算法中起着重要作用,且满足CoHUIM minCor1 ≤ CoHUIM minCor2 ≤ CoHUIM minCor3 ≤ CoHUIM minCor4 ≤ CoHUIM minCor5。这是因为在固定最小效用(minUtil)的情况下,较高的minCor会使满足条件的模式减少,生成的候选集也相应减少,从而缩小搜索空间。同时,最小正相关阈值对运行时间有显著影响,一般来说,具有较高minCor的CoH
超级会员免费看
订阅专栏 解锁全文
2236

被折叠的 条评论
为什么被折叠?



