布尔查询时使用词项文档关联矩阵,然后矩阵的大小过大,而且极度稀疏,所以产生了倒排索引。
倒排索引的两个部分。词典部分往往放在内存中,而指针指向的每个倒排记录表则往往存放在磁盘上;
词典按照字母顺序表,倒排索引按照文件的ID号顺序。
倒排索引的两个部分。词典部分往往放在内存中,而指针指向的每个倒排记录表则往往存放在磁盘上;
词典按照字母顺序表,倒排索引按照文件的ID号顺序。
本文介绍了布尔查询中使用的倒排索引技术。为解决词项文档关联矩阵过大的问题,提出了倒排索引,该索引由两部分组成:位于内存中的词典部分和存储于磁盘上的倒排记录表。词典按字母顺序排列,倒排索引则按文件ID顺序组织。

被折叠的 条评论
为什么被折叠?