资源下载
建立索引 用到布尔代数的概念 对于每个关键词有一组布尔表达式对于即0 1 对于 如:”我们“这个关键词 它对于的索引为01011001111110001111111010101.........
有多少个有用的网页就有多少位01位数,可能可以根据每个网页的有效率和大多数关键字只出现在一部分网页上的等等特征进行压缩,但是位数还是很大。
索引很大,一个服务器内存放不下,就要用到分布式,利用多个服务器进行存储,查询是多个服务器并行处理,然后把结果送到主服务器进行合并处理。
对索引进行排序
最好的改进引擎的思路:每天分析不好的搜索结果。