信息检索(Information Retrieval)
是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。
狭义的信息检索就是信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查寻(Information Search 或Information Seek)。
网络信息检索
也即网络信息搜索,是指互联网用户在网络终端,通过特定的网络搜索工具或是通过浏览的方式,查找并获取信息的行为。
元搜索引擎
指在统一的用户查询界面和信息反馈形式下,共享多个搜索引擎的资源库,为用户提供信息资源检索的系统。是对分布于网络的多种检索工具的全局控制机制。
元搜索引擎由检索请求提交机制、检索接口代理机制、检索结果显示机制三部分组成。
SCI
《科学引文索引》(Science Citation Index, SCI)是由美国科学信息研究所(ISI)1961年创办出版的引文数据库
EI
《工程索引》(The Engineering Index,简称EI)创刊于1884年,是美国工程信息公司(Engineering information Inc.)出版的著名工程技术类综合性检索工具。
获取文献出版信息的主要检索工具
l 1. 出版商网站
– 检索出版社的信息
– 中国出版工作者协会 http://www.pac.org.cn
– 中国图书出版网 http://chinabook.gapp.gov.cn/
l 国外的出版商强调自己的专业特色
– 麦克米伦的计算机出版社
– Prentice Hall的大学书籍
– 科技类的Springer-Verlag
– Wilson的书目类工具书
– Merriam-Webster的字典出版商
l 2.出版目录数据库
– 美国在版书目数据库
l Bowker’s Books In print Database (http://www.booksinprint.com )
l 全球版书目( http://www.globalbooksinprint.com )
– 英国在版书目数据库
– 乌利希国际期刊指南
l 期刊名录数据库
l 3. 网络书店
– 当当网上书店(http://www.dangdang.com )
– 800 网上书店(http://www.book800.com )
– 中国图书网(http://www.bookschina.com )
– 席殊书屋(http://www.xishu.com.cn )
– 贝塔斯曼在线(http://www.bol.com.cn )
– 亚马逊网上书店(http://www.amazon.com )
获取文献收藏信息的主要检索工具
l 数字图书馆与馆藏目录数据库
– 中国国家书目数据库
– 国家图书馆民国时期中文图书书目数据库
– 民国时期期刊书目数据库
l CALIS 目录数据库
– 联合目录数据库
– 中文现刊目次库
l OCLC世界书目
– worldCat是世界范围图书馆的图书和其他资料的联合目录数据库,是OCLC核心数据库之一。在OCLC的First Search系统中提供服务
l 美国国会图书馆联机目录Library of Congress Online Catalog
– 反映美国国会图书馆基本馆藏的书目工具
l OCLC 期刊联合目录
– 反映期刊馆藏信息的数据库
索引文摘类检索工具
l 万方数据库科技信息检索子系统
l 中科院文献情报中心文摘数据库
l 中科院科学数据库(http://www.sdb.ac.cn )
l 全国报刊索引
l 联合西文期刊篇目目次库
l Wilson
l Wilson网络数据库(http://www/hwwilson.com )
l ……
l 或直接利用全文期刊数据库
专利检索
专利公报:专利公报是各国专利局或国际性专利组织报导专利申请审批状况及相关法律、法规信息的定期出版物。多为周刊,也有旬、半月或月刊形式。中国专利局于1985年按发明类型出版3种公报:《发明专利公报》、《实用新型专利公报》和《外观设计专利公报》。
专利索引:专利索引是以专利说明书的某一著录项目为依据编制的检索目录。 如:《中国专利索引》 、《世界专利索引》
网上专利信息检索工具 :国内外专利网站、专利数据库系统
• 分类检索
• 申请人/专利权人检索
• 申请号/专利号检索
ISI Web of Knowledge跨库检索特点
简单跨库检索
在CrossSearch检索框中输入一个词、词组、一句短语即可进行简单跨库检索。输入的检索词允许使用布尔逻辑运算符(“NOT”、“AND”、“OR”),通配符(“*”和“?”,用在检索词的中间和词尾,“?”代表一个字符,“*”代表零个或若干个字符,? ?代表2个字符),位置算符(“SAME”或“SENT”,用于规定其前后连接的两个词在检索记录中出现在同一句中,或同一个词组中)等。然后点击SEARCH,即可查到Web of Knowledge平台上机构已购买的所有数据库的检索结果,完成跨库检索。
复杂跨库检索
ISI Web of Knowledge推出的增强的跨库联合检索功能不仅可以同时检索所在机构订购的基于ISI Web of Knowledge平台上的所有资源,而且可以通过CrossSearch.检索不在ISI Web of Knowledge平台上但对研究者来说非常重要的学术信息资源(具体资源情况见ISI Web of Knowledge外部资源列表)
检索功能强大
ISI Web of Knowledge不仅可以进行单个数据库资源检索,还可以实现跨库检索。为了更有效地整合这些资源,ISI Web of Knowledge开发了跨库检索软件-CrossSearch.实现对ISI Web of Knowledge平台中的所有数据库的一站式检索。CrossSearch可根据需要选择参与交叉检索的数据库,一次可以检索多个数据库,且对命中结果做了查重处理,重复收录的文献集中在一个记录中列出。并可根据需要选择浏览不同数据库的全记录信息,节省了检索时间。
强大的跨库交叉检索能力,将来源于学术期刊、技术专利、会议录、化学反应、网站资源及其它各种高质量信息资源整合在同一系统内,提供了自然科学、工程技术、社会科学、艺术与人文等多个领域中高质量的学术信息,兼具知识的检索、提取、管理、分析与评价等多项功能,从而大大扩展和加深了信息检索的广度和深度
建立了动态的学术信息门户
ISI Web of Knowledge以web of Science 为核心的跨库体系一改过去使用的各种数据库都是以一种零散的、孤立的状态存在着,即使若干个库捆绑在一起,也仅仅局限在使用同一界面层次上,体现不出文献内在的相互联系的检索局面。该体系利用论文之间相互引证的关系,建立起不同类型资源之间的关系,最大限度地保持知识体系的完整性,使之成为一个有机的整体,从而消除了由于数据库收录范围有限而造成 知识体系的割裂。这种对资源的整合构成了一个动态的学术信息门户,可以全方位地为科学研究提供文献信息保障,使科研工作者得以了解与其研究领域相关的各种类型文献,以及学科过去、现在和将来的脉络发展与交叉。
.3提供了一站式服务,方便读者获取原文
ISI Web of Knowledge提供了各种途径协助读者获取全文,这些途径包括:
.3.1一次点击获取全文
ISI Web of Knowledge可以直接连接到机构有权限访问的各种全文数据库(无论是图书馆采购的全文数据库,还是互联网上免费的全文学术期刊。ISI Web of Knowledge 目前可以提供超过300家出版社、1万多种期刊的全文连接,其中包括被ISI 收录的近200种Open Access期刊的全文。
.3.2与图书馆OPAC系统或联合编目系统的连接
目前ISI Web of Knowledge可以为每一个机构定制多达8个此类系统的连接,帮助读者充分利用馆藏的信息资源。
.3.3提供作者电子邮件地址
.3.4提供与文献传递服务或馆际互借系统的连接
.3.5 提供与 OpenURL 资源调度服务的连接http://acm.lib.tsinghua.edu.cn
◆ACM全文期刊29种,会议录近170种。
◆超过69,000篇的全文文章来自期刊、杂志、和会议录。
◆1954年至今出版的期刊、杂志目录以及超过23,000 篇的引用文献。
◆1985年至今出版的990多卷会议记录的文章目录以及超过48,000 篇的引用文献。
◆与ACM文章关联的大约150万篇参考文献。其中20万篇参考文献链接有全部书目资料,5万篇可以链接全文。
◆更多的参考链接和被引用的链接。
◆ACM的“在线计算机文献指南”:可以查询和浏览来自计算机领域重点出版社的巨大书目资料库,包括图书、期刊、会议录和论文。同时ACM也提供了如何浏览计算机文献引文书目的指导方式。
系统收录的文献有三大类型:1. Periodical:定期出版物,细分为四种,Journals, Magazines, Newsletters, Transactions;2. Proceedings:会议录3. Books:图书
1.在检索结果显示页面,每一条记录题名后有不同的标识
2.要保存或打印全文,必须使用Acrobat Reader打开全文,然后使用该阅读器的保存和打印功能进行操作。
自然语言搜索引擎的特点
§ 1. 更高的搜索的易用性
Ø 由于智能搜索引擎具有智能分词功能,因此使得查询变得更为简单、易于操作。
¡ “刘德华的最新个人专辑”,
¡ “刘德华 最新 个人专辑”才能够找到搜索的内容。
§ 2. 搜索结果的范围定位准确
Ø 由于采用知识(概念)检索技术,明确和缩小了搜索范围,减少了对无用信息的搜索。
Ø 查找“北京的天气”只需要输入“北京天气”就可以找到相关程度甚高的北京的天气预报,同时还会给出相关的天气内容。而在传统搜索引擎的查询结果中不但有北京天气的内容,还会给出所有与北京天气字样有关的各种内容,增大了用户查找搜索结果的难度。
§ 3.搜索结果智能性
Ø 由于智能搜索引擎有综合知识库为背景,使得信息检索与导航服务更具有智能性。
Ø 知识库中的知识有助于解决表达差异的问题。所谓表达差异就是用户使用不同的词表达同一概念。而知识库中关于同义词的定义正好可以消除这种表达差异带来的检索困难。
Ø 更有利于用户表达其真正意图
width="728" scrolling="no" height="90" frameborder="0" align="middle" src="http://download1.youkuaiyun.com/down3/20070601/01184120111.htm" marginheight="0" marginwidth="0">