6、挖掘广泛讨论话题的有用时间图模式及业务流程模型查询方法

挖掘广泛讨论话题的有用时间图模式及业务流程模型查询方法

在当今信息爆炸的时代,网络上广泛讨论的话题蕴含着丰富的信息,挖掘这些话题的时间图模式以及对业务流程模型进行有效查询,对于信息检索和业务分析具有重要意义。

挖掘广泛讨论话题的时间图模式

在挖掘广泛讨论话题的时间图模式时,当设置最小支持度(minSup)为 4 时,能在几分钟内获得结果。分析挖掘出的特征模式,发现有四种类型的节点在所有模式中普遍出现:
- 类型 (a) 页面 :在早期创建,对应标签 N0,与不同时期创建的许多页面相连。它通常是新闻网站上首次报道该话题的页面,或者是首个讨论该话题的博客文章,可视为话题的主要来源。
- 类型 (b) 页面 :在增长期创建,对应标签 N1,被增长期和稳定期创建的许多页面链接。这类页面常链接到类型 (a) 的页面,包含有吸引力的观点或关于该话题的优质信息,多由知名博主撰写,能引发众多博主对该话题的兴趣,可看作讨论增长期的触发因素。
- 类型 (c) 页面 :在稳定期创建,链接到包括类型 (a) 和 (b) 在内的许多页面。
- 类型 (d) 页面 :在增长期创建,同样链接到包括类型 (a) 和 (b) 在内的许多页面。类型 (c) 和 (d) 的页面是链接到权威页面的枢纽页面,它们常总结过去的讨论、定义讨论中的冲突并得出结论,被称为总结者。

为验证挖掘出的模式是否可用于信息检索,我们通过以下步骤进行操作:
1. 使用爬虫以多个话题的枢纽页面为源收集网页,构建由这些页面组成的网页图。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值