1. 减除无关资料
有时候,排除含有某些词语的资料有利于缩小查询范围。
百度支持“-“功能,用于有目的地删除某些无关网页,但减号之前必须留一空格,语法是“A -B“。
2. 并行搜索
使用“A | B“来搜索“或者包含关键词A,或者包含关键词B“的网页。
*百度高级搜索技巧
把搜索范围限定在网页标题中——intitle
网页标题通常是对网页内容提纲挈领式的归纳。把查询内容范围限定在网页标题中,有时能获得良好的效果。使用的方式,是把查询内容中,特别关键的部分,用“intitle:”领起来。
把搜索范围限定在特定站点中——site
有时候,您如果知道某个站点中有自己需要找的东西,就可以把搜索范围限定在这个站点中,提高查询效率。使用的方式,是在查询内容的后面,加上“site:站点域名”。
把搜索范围限定在url链接中——inurl
网页url中的某些信息,常常有某种有价值的含义。于是,您如果对搜索结果的url做某种限定,就可以获得良好的效果。实现的方式,是用“inurl:”,后跟需要在url中出现的关键词。
精确匹配——双引号和书名号
如果输入的查询词很长,百度在经过分析后,给出的搜索结果中的查询词,可能是拆分的。如果您对这种情况不满意,可以尝试让百度不拆分查询词。给查询词加上双引号,就可以达到这种效果。
精确匹配——双引号和书名号
如果输入的查询词很长,百度在经过分析后,给出的搜索结果中的查询词,可能是拆分的。如果您对这种情况不满意,可以尝试让百度不拆分查询词。给查询词加上双引号,就可以达到这种效果。
布尔检索
布尔检索是数据库检索最基本的方法,是用逻辑"或"(+、OR)、逻辑"与"(×、AND)、逻辑"非"(-、NOT)等算符在数据库中对相关文献的定性选择的方法。
(1)
逻辑"或"(+、OR):用来组配相同概念的词,文献中凡含有"A"或者"B"检索词或者同时含有检索词"A"和"B"的文献均为命中文献。组配方式:A+B,表示检索含有"A"词,或含有"B"词,或同时包含"A"、"B"两词的文章。这样的组配可以放宽范围,扩增检索结果,提高查全率。
(2)
逻辑"与"(*、AND):检索时,数据库中同时含有检索词"A"和检索词"B"的文献才是命中文献。组配方式:A×B,表示检索必须同时含有"A"、"B"两词的文章。这样的组配增加了限制条件,即增加检索的专指性,以缩小范围,减少文献输出量,提高检准率。
(3)
逻辑"非"(-、NOT):数据库中凡含有检索词"A"而不要检索词"B"的文献,为命中文献,是用来检索中排除某些词的。组配方式:A-B,表示检索出含有"A"词而不含有"B"词的文章,用于排除不希望出现的检索词,能够缩小命中文献范围,增强检索的准确性。
限制检索
限制检索(Range)是通过限制检索范围,达到优化检索结果的方法。限制检索的方式有多种,例如进行字段检索、使用限制符、采用限制检索命令等。
位置检索也叫临近检索。文献记录中词语的相对次序或位置不同,所表达的意思可能不同,而同样一个检索表达式中词语的相对次序不同,其表达的检索意图也不一样。布尔逻辑运算符有时难以表达某些检索课题确切的提问要求。字段限制检索虽能使检索结果在一定程度上进一步满足提问要求,但无法对检索词之间的相对位置进行限制。位置算符检索是用一些特定的算符(位置算符)来表达检索词与检索词之间的临近关系,并且可以不依赖主题词表而直接使用自由词进行检索的技术方法。
按照两个检索出现的顺序相距离,可以有多种位置算符。而且对同一位置算符,检索系统不同,规定的位置算符也不同。以美国DIALOG检索系统使用的位置算符为例,介绍如下。
(1)“(W)”算符
“W”含义为“with”。这个算符表示其两侧的检索词必须紧密相连,除空格和标点符号外,不得插入其他词或字母,两词的词序不可以颠倒。“(W)”算符还可以使用其简略形式“()”。例如,检索式为“communication
(W) satellite”时,系统只检索含有“communication satellite”词组的记录。
(2)“(nw)”算符
“(nw)”中的“w”的含义为“word”,它允许两词间插入最多为n个其他词,包括实词和系统禁用词,词序不变。
(3)“(N)”算符
“(N)”中的“N”的含义为“near”.这个算符表示其两侧的检索词必须紧密相连,除空格和标点符号外,不得插入其他词或字母,两词的词序可以颠倒。
(4)“(nN)”算符
“(nN)”表示允许两词间插入最多为n个其他词,包括实词和系统禁用词。
(5)“(F)”算符
“(F)”中的“F”的含义为“field”。这个算符表示其两侧的检索词必须在同一字段(例如同在题目字段或文摘字段)中出现,词序不限,中间课插任意检索词项。
(6)“(S)”算符
“(S)”中的“S”含义为“sentence”,表示其两侧的检索词必须在同一句子中出现,两词的词序可以颠倒。
加权检索
1.加权检索
加权检索是某些检索系统中提供的一种定量检索技术。加权检索同布尔检索、截词检索等一样,也是文献检索的一个基本检索手段,但与它们不同的是,加权检索的侧重点不在于判定检索词或字符串是不是在数据库中存在、与别的检索词或字符串是什么关系,而是在于判定检索词或字符串在满足检索逻辑后对文献命中与否的影响程度。加权检索的基本方法是:在每个提问词后面给定一个数值表示其重要程度,这个数值称为权,在检索时,先查找这些检索词在数据库记录中是否存在,然后计算存在的检索词的权值总和。权值之和达到或超过预先给定的阈值,该记录即为命中记录。
运用加权检索可以命中核心概念文献,因此它是一种缩小检索范围提高检准率的有效方法。但并不是所有系统都能提供加权检索这种检索技术,而能提供加权检索的系统,对权的定义、加权方式、权值计算和检索结果的判定等方面,又有不同的技术规范