网络智能与图像检索:信息处理新策略
在当今数字化时代,信息的有效处理和检索变得至关重要。本文将探讨两个重要的领域:信息级联检测中的网络智能应用以及语义图像检索中用户意图的理解。
信息级联检测中的网络智能应用
在进行信息级联检测研究时,由于Twitter的限制,以往使用的数据集不再可用或可共享。唯一免费获取Twitter数据的方式是通过其RESTful API,但这些API存在限制,每个方法在约15分钟的速率限制窗口内仅允许15个请求,这导致获取小数据集需要很长时间,并且在调用之间可能会丢失一些数据。
为了解决这个问题并测试所提出的方法,研究人员选择了协作数据集Core Dataset进行实验,并将其视为一个社交网络。具体操作步骤如下:
1. 构建基础图 :使用存储库记录的元数据字段“作者列表”构建合著图。
2. 定义消息 :将每篇论文的标题和摘要的串联视为消息,由第一作者发布给所有合著者,合著者被视为追随者。
3. 数据准备 :
- Core Dataset是全球期刊存储库的开放获取研究成果集合,提供了元数据文件(2390万项)和内容数据集(400万项)。研究使用了2016年10月最后一次转储的Core数据集的存储库2。
- 首先将存储库2文件作为集合导入到NoSQL数据库MongoDB中。
- 然后按出版日期对论文信息进行升序排序,以保留发布的时间顺序。
4. 生成关键词和概念 :使用IBM Watson NLU API生成关键词和概念,并构建哈希表作为Pyt
超级会员免费看
订阅专栏 解锁全文
35万+

被折叠的 条评论
为什么被折叠?



