信息检索:随机游走与扩散激活,该选哪个?
适用人群与导师介绍
这个中级教程面向对为信息检索和发现设计更有效的用户体验和界面感兴趣的信息检索(IR)研究人员、从业者、信息架构师和搜索专家。对以用户为中心的设计基本原则有所了解会有帮助,但并非必需。
导师托尼·拉塞尔 - 罗斯是UXLabs的创始人兼董事,这是一家专注于复杂搜索和信息访问应用的研究与设计咨询公司。在创立UXLabs之前,他是Endeca的用户体验经理,也是Endeca设计模式库的编辑。再之前,他曾在路透社担任技术主管,还在佳能欧洲研究中心担任研发经理。他拥有人工智能博士学位、认知心理学硕士学位以及工程学本科学位,发表了70多篇关于搜索、用户体验和文本分析的科学论文,并著有《设计搜索体验:发现的信息架构》。
信息检索新趋势与挑战
如今,数据之间的连接越来越紧密,比如通过语义网平台或社交网络,这使得结构化信息检索成为获取更相关数据对象的一种选择。在这个背景下,如何“智能”地遍历数据对象构成的图并利用它们之间的关联,成为了信息检索中的一个主要挑战。常用的方法有马尔可夫链随机游走和扩散激活。
背景知识
- 扩散激活 :其应用理念源于关联检索,可通过检索与查询相关的信息来获取相关内容。它有多种用途,例如用于识别相关术语和文档以改进检索过程,用于语义网搜索,以及根据用户上下文和交互确定本体中的重要元素。
- 随机游走 :PageRank是利用随机游走的典型例子,它根据网页图中各页面的权威权重对网站进行排名。此外,随机游走还可用于图像检索、社交标注图分析和查询扩