倒排索引是什么

我们打开NBA中国官⽹,搜索james得到以下结果

我们打开 NBA 中国官⽹,搜索 james 得到以下结果:

 

假设⽂档集合如下图所示


1、 我们是怎么通过james查找到名字带有james的球员呢?
2、 如果按照这个图,我们是不是得把这5个⽂档遍历⼀遍,把⽂档带有james的球员查找出来?
3、如果按照这种顺序扫描,那每次输⼊不同的关键字,岂不是要从头到尾遍历⼀遍?
 


假设⽂档集合如下图所示


1、我们把这个5个球员的名字进⾏分词,每个分词转成⼩写字⺟,并且以每个分词分组,

        统计它所在⽂档的位置。
2、 当有关键字请求过来的时候,将关键字转成⼩写,查找出关键字匹配到的⽂档位置,

        然后全部返回。


 

完善倒排索引

参数解释:

        DocId:单词出现的⽂档 id
        TF:单词在某个⽂档中出现的次数
        POS:单词在⽂档中出现的位置
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值