经典信息检索模型(一)
一.布尔模型:
布尔模型是基于集合理论和布尔代数的一种简单的检索模型。由于集合的概念非常直观,所以布尔模型为信息检索系统的普通用户提供了一种易于掌握的框架,此外,查询被表示成有确切语义的布尔表达式。由于布尔模型内部简单,形式简洁,在过去的几年的几年引起了人们广泛关注,并且在早期的许多商业系统中得以采用。
布尔模型假定标引词(关键词)在文献中要么出现要么不出现,因此标引词的权值全部被设为二值数据,Wi,j∈{0,1},查询词q由连接词not,and,or连接起来的多个标引词所组成。这样,查询q本质上是一个常规的布尔表达式,它可以表示为多个何去向量的析取,即析取范式DNF。比方说,查询[q = Ka∧(Kb∨¬Kc)],可以写成析取范式的形式[qdnf =(1,1,1) <