计算机信息检索理论”
内容 1、计算机信息检索的基本理论 2、网络检索的基本知识 3、如何检索中外文数据库 中文主要数据库的使用方法 国外主要数据库的检索方法 4、信息检索与运用实例 一 概述 手工检索工具过去是检索文献的唯一途径 最早的印刷型检索工具距今已有100多年了,例如:美国《工程索引》(Ei)创刊于1884。手工检索工具经过多年发展体系已非常完善,这为以后的计算机检索奠定了基础。 计算机检索成为文献检索的主要途径 随着Internet的广泛应用以及计算机技术与存储技术发展,光盘数据库检索、联机数据库检索和网络信息检索是计算机检索的主要形式,网络检索成为信息检索的重点。 一 概述 1、计算机信息检索的发展 经历了四个发展阶段: 脱机批处理检索(1954-1965) 联机检索(1965-1985) 光盘检索(1985-1991) 网络检索(1991-) 一 概述 2、计算机信息检索含义及原理 含义: 广义的计算机信息检索实际上包括计算机信息的存储和计算机信息的检索两个相互依存的过程。 原理: 通过计算机作为工具,将信息的特征标识与用户的提问标识相匹配,从而来完成信息检索。 二 计算机检索系统构成 从整体上讲,计算机信息检索系统由硬件、软件和数据库三部分构成。 二 计算机检索系统构成 数据库是计算机信息检索系统的信息源和核心。他是以某种特定方式组织和存储数据资料的仓库。 数据库的构成:数据库包含若干个文档,文档又有若干个记录构成,记录又由若干个字段组成。 三 计算机信息检索技术 计算机信息检索的过程实际上使检索词与标引词比较的过程。单个检索词比较简单,两个或两个以上的检索词则需要先根据检索课题的要求对检索词进行组配。基本的检索技术有逻辑检索、截词检索、邻近位置检索、限制 检索等。 三 计算机信息检索技术 1.逻辑检索 逻辑检索是一种比较成熟、比较流行的检索技术,现代信息检索系统都支持这种技术。逻辑检索的基础是布尔逻辑运算,其关系符为:“与(AND)”、“或(OR)”、“非(NOT)”,此外还有大于、小于、等于、不等于等运算。 例如,要查找儿童教育( children education)方面的文献,检索逻辑式为: 儿童 并且 教育或儿童 AND 教育 “education*children”或者“education AND children”。 例如,要查找“汽车”方面的文献,检索逻辑式为:“car+automobile”或者“car OR automobile”。 例如,要查找有关能源( energy),但又不涉及核能( nuclear)方面的文献,检索逻辑式为: 能源 NOT 核能 “energy NOT nuclear”或者“energy-nuclear”。 “逻辑与”,将会缩小检索范围,提高检索信息的查准率。 “逻辑或”,可扩大检索范围,能够提高检索信息的查全率。 “逻辑非”剔除了不需要的概念,可提高查准率,但有时影响查全率。 复杂逻辑提问举例: (A*B+C)*(D+E)+F 在一个检索式中如果含有两个以上的布尔逻辑符就要注意运算次序: ()>NOT>AND>OR, 即先算括号内的逻辑关系,再依次算“非”、“与”、“或”关系。 三 计算机信息检索技术 2. 截词检索 截词符有一般用 “?”、“*” 1)按截断的位置分: 右截断 (前方一致) 左截断 (后方一致) 中间截 (中间屏蔽): 例analys?s,检出含有analysis和analyses的文献 2)按截断的字符数量分: 有限截词: process?? 检出 process、processes? 无限截词:如prevent* 检出prevent,prevents,prevented,preventing,prevention,preventable 三 计算机信息检索技术 3.