序列模式挖掘算法对比与业务导向的Web服务处理和发现框架研究
在当今的信息技术领域,序列模式挖掘算法以及Web服务的处理与发现都是重要的研究方向。下面将分别介绍SPAM和PrefixSpan序列模式挖掘算法的对比实验结果,以及一种业务导向的Web服务处理和发现框架。
1. SPAM和PrefixSpan序列模式挖掘算法对比实验
为了测试SPAM和PrefixSpan等序列模式挖掘算法的效率,研究人员以蛋白质序列作为输入数据集,在Java独立应用程序上进行实现。实验在1.46GHz英特尔奔腾双核CPU、512MB主内存、运行Microsoft XP和J2SE运行环境1.5的机器上进行。
- 实验一:不同最小支持度下的运行时间
- 该实验通过改变最小支持度(从10到50),测量两种算法的执行时间。结果如图5所示,SPAM所需的时间比PrefixSpan少很多。此实验选用了包含528个序列的文本文件。
- 实验二:不同序列数量下的运行时间
- 当文本文件中序列数量仅为2时进行该实验。结果表明,如果序列数量太少,PrefixSpan的表现比SPAM更好。
- 实验三:不同最小支持度下的内存利用率
- 再次将最小支持度从10变化到50,测量两种算法的内存利用率(以字节为单位)。随着最小支持度的增加,内存利用率也随之增加。
超级会员免费看
订阅专栏 解锁全文
3077

被折叠的 条评论
为什么被折叠?



