信息级联检测与图像检索意图理解
在当今数字化时代,信息的传播和图像的检索是两个重要的研究领域。前者有助于我们理解信息在网络中的流动模式,后者则能帮助用户更精准地获取所需图像。下面将分别介绍信息级联检测和语义图像检索中理解用户意图的相关研究。
信息级联检测实验
由于Twitter的限制,以往研究使用的数据集不再可用或可共享。唯一免费获取Twitter数据的方式是通过其RESTful API,但这些API有请求限制,每15分钟的速率限制窗口内每个方法仅允许15次请求,这导致获取小数据集耗时久且可能丢失数据。
为解决此问题并测试提出的方法,研究人员选择了协作数据集Core Dataset进行实验,将其视为社交网络。具体操作步骤如下:
1. 构建基础图 :使用存储库记录的元数据字段“作者列表”构建共同作者图。
2. 定义消息 :将每篇论文的标题和摘要连接起来作为消息,由第一作者发布给所有共同作者(共同作者仅为第一作者的直接关注者)。
3. 数据导入与排序 :
- 将Core数据集存储库2的文件作为集合导入到NoSQL数据库MongoDB中。
- 按论文的出版日期(“dc:date”)升序对论文信息进行排序,以保留发布的时间顺序。
4. 生成关键词和概念 :使用IBM Watson NLU API生成关键词和概念,然后将其构建为Python字典形式的哈希表。
5. 提取频繁路径 :使用InFlowMine算法从之前构建的哈希表中提取频
超级会员免费看
订阅专栏 解锁全文
16

被折叠的 条评论
为什么被折叠?



