
数据挖掘
QyngLanF
这个作者很懒,什么都没留下…
展开
-
数据挖掘:数据立方体的多路数组聚集
数据立方体的多路数组聚集最近上课老师讲到数据立方体,讲到了数据立方体的预处理。为什么要预处理?因为如果不预处理的话,每次需要相关信息都需要从头计算,需要消耗大量的时间,因此为了便于选取数据,需要对数据立方体进行预处理。预处理一般分为两种:部分处理(冰山立方体,外壳立方体等等)完全处理,下文就要讨论一种完全处理的方式:多路数组聚集。用最简单暴力的方法来进行完全处理的话,在应对很大的数据集...原创 2019-03-13 20:06:01 · 2451 阅读 · 2 评论 -
数据挖掘过程中的问题:FP-Tree构建过程中的问题
FPTree 建立的一个小问题:相同输入输出不同前两天,在自己实现FP-growth算法后,用测试数据集做测试时,发现了一个奇怪的现象:相同的输入,输出的结果却不一致。一开始以为是读取数据集的过程中出现了问题,然而同样的数据集用Apriori算法实现却没有出现这样的情况。于是开始检查FP-growth的问题。仔细思考这样的问题为什么会出现?第一个反应是是否是因为排序的结果不稳定导致,因为在所有...原创 2019-04-26 16:15:56 · 314 阅读 · 0 评论