利用优势比改进专业知识推荐系统
1. 引言
传统上,推荐系统是解决信息过载问题的一种方法。但在大型组织中,它们成为了一种有助于高效定位具有所需专业知识人员的技术。随着组织不断寻求更好的方法来挖掘其内部知识资本,并促进员工之间的协作以提高生产力,此类专业知识推荐系统变得越来越重要。
随着信息技术的发展,专业知识推荐方法已从使用存储每个员工知识的数据库,转向在异构集合中自动挖掘专业知识表示。专业知识推荐系统的核心是专家发现,即搜索合适的专家进行推荐。2005 年,TREC 的企业赛道推出了专家搜索任务,将专家发现问题表述为一个检索任务,根据特定的主题查询对候选专家进行排名。大多数参与该任务的系统都应用了先进的信息检索(IR)方法,如语言建模技术。
例如,Cao 等人提出的两阶段语言模型在 2005 年表现出色,并在 2006 年的 TREC 中流行起来。在这个模型中,每个文档被表示为主题词袋和专家实体袋。对于每个文档,会创建一个主题词的语言模型(相关模型)和一个专家实体的语言模型(共现模型)。通过假设候选专家和查询之间的条件独立性,从这两种语言模型中计算候选专家的概率得分,其通用表示为:
[P(e|q) = \sum_{d} P(d|q)P(e|d)]
其中,(e) 表示候选专家,(q) 表示主题查询,(d) 表示文档。
2. 建模分析
2.1 专家发现的语言模型及其平滑处理
确定给定主题的专家候选人问题可以表述为“给定主题查询 (q),候选人 (e) 成为专家的概率是多少”。即根据概率 (P(e|q)) 对候选人进行排名,排名靠前的候选人被认为是给定主题最有可能的专家。
为了
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



