
频繁序列
文章平均质量分 88
DeeFOX
架构师之路
展开
-
日记2015/1/20
今日效率有点低了,早上仅仅完成了代码的融合部分,到下午为了能在那堆14万session的数据集上跑出一个结果搞了半天还是不行!可以断定用GSP在如此大的数据集上做频繁序列挖掘是几乎不可能完成的,每次都要做数据库扫描这种方法明显不可能!spade算法在计算支持度的时候利用了已有频繁序列的计数,因此在计算支持度的时候只需要计算序列某个子集下的计数,大大减少了全表扫描的及数量!明天实现以下才行~还有~~原创 2015-01-21 01:13:59 · 402 阅读 · 0 评论 -
频繁序列模式挖掘
1.频繁序列模式挖掘序列模式是频繁模式的一种特殊情况,它们的应用范围完全不一样!如:购买物品尿布、啤酒、可乐面包、尿布、啤酒上述购物清单是两个用户的购物清单,根据上面的清单,我们可以发现尿布和啤酒组合起来一起购买的情况较多,因此超市可以根据这样的频繁项集分析,将尿布和啤酒放在较近的地方,或者将尿布和啤酒同时促销等增加销量。原创 2015-01-20 00:33:26 · 5420 阅读 · 0 评论