本文是中国人工智能学会编著的《人工智能导论(面向非计算机专业)》第三章的摘要与笔记,仅供个人学习之用。其它章节请访问下列相应 URL。
第一章 绪论
第二章 概念表示
第三章 知识表示(本章)
章节目录
第三章
人类的智能活动主要是获得并运用知识。知识是智能的基础。为了使计算机具有智能,能模拟人类的智能行为,就必须使它具有知识。但人类的知识需要用适当的模式表示出来,才能存储到计算机中并能够被运用。因此,知识的表示称为人工智能中一个十分重要的研究课题。
3.1 知识与知识表示的概念
3.1.1 知识的概念
知识是人们在长期的生活及社会实践中、在科学研究及实验中积累起来的对客观世界的认识与经验。人们把实践中获得的信息关联在一起,就形成了知识。一般来说,把有关信息关联在一起所形成的信息结构称为知识。(知识是一种信息结构。作为一种结构,很容易联想到能否用某种数据结构来表示知识。这个问题在以下“知识表示”部分探讨)
信息之间有多种关联形式,其中用得最多的是一种用“如果……,则……”表示的关联形式。在人工智能中,这种知识被称为“规则”,它反映了信息之间的某种因果关系。
例如,我国北方的人们经过多年的观察发现,每当冬天即将来临,就会看到一批批的大雁向南方飞去,于是把“大雁向南飞”与“冬天就要来临了”这两个信息关联在一起,得到了如下知识:如果大雁向南飞,则冬天就要来临了。
又如,“雪是白色的”也是一条知识,它反映了“雪”与“白色”之间的一种关系。在人工智能中,这种知识被称为“事实”。
3.1.2 知识的特性
1. 相对正确性
知识是人类对客观世界认识的结晶,并且受到长期实践的检验。因此,在一定的条件及环境下,知识是正确的。*这里,“一定的条件及环境”是必不可少的,它是知识正确性的前提。因为任何知识都是在一定的条件及环境下产生的,因而也就只有在这种条件及环境下才是正确的。*知识的这一特性称为相对正确性。
例如,1+1=2,这是一条妇孺皆知的正确知识,但它也只是在十进制的前提下才是正确的;如果是二进制,它就不正确了。
在人工智能中,知识的相对正确性更加突出。除了人类知识本身的相对正确性外,在建造专家系统时,为了减少知识库的规模,通常将知识限制在所求解问题的范围内。也就是说,只要这些知识对所求解的问题是正确的就行。
例如,在后面介绍的动物识别系统中,因为仅仅识别虎、金钱豹、斑马、长颈鹿、企鹅、鸵鸟、信天翁七种动物,所以知识“IF 该动物是鸟 AND 善飞,则该动物是信天翁”就是正确的。
2. 不确定性
由于现实世界的复杂性,信息可能是精确的,也可能是不精确的、模糊的;关联可能是确定的,也可能是不确定的。这就使知识并不总是只有“真”与“假”两种状态,而是在“真”与“假”之间存在许多中间状态,即存在为“真”的程度问题。知识的这一特性称为不确定性。
造成知识具有不确定性的原因是多方面的,主要有:
①由随机性引起的不确定性。 由随机事件所形成的知识不能简单地用“真”或“假”来刻画,它是不确定的。
例如,“如果头痛且流涕,则有可能患了感冒”这条知识,虽然大部分情况是患了感冒,但有时候具有“头痛且流涕”的人不一定都是“患了感冒”。其中的“有可能”实际上就是反映了“头痛且流涕”与“患了感冒”之间的一种不确定的因果关系。因此,它是一条具有不确定性的知识。
②由模糊性引起的不确定性。 由于某些事物客观上存在的模糊性,使得人们无法把两个类似的事物严格区分开来,不能明确地判定一个对象是否符合一个模糊概念;又由于某些事物之间存在着模糊关系,使得我们不能准确地判定它们之间地关系究竟是“真”还是“假”。像这样由模糊概念、模糊关系所形成的知识显然是不确定的。
例如,“如果张三长得很帅,那么他一定很受欢迎”,这里的“长得很帅”“很受欢迎”都是模糊的。
③由经验引起的不确定性。 人们对客观世界的认识是逐步提高的,只有在积累了大量的感性认识后才能升华到理性认识的高度,形成某种知识。因此,知识有一个逐步完善的过程。在此过程中,或者由于客观事物表露得不够充分,致使人们对它的认识不够全面;或者对充分表露的事物一时抓不住本质,使人们对它的认识不够准确。这种认识上的不完全、不准确必然导致相应的知识是不准确的、不确定的。不完全性是使知识具有不确定性的一个重要原因。
3. 可表示性与可利用性
知识的可表示性是指知识可以用适当的形式表示出来,如用语言、文字、图形、神经网络等,这样才能被存储、传播。知识的可利用性是指知识可以被利用。这是不言而喻的,我们每个人天天都在利用自己掌握的知识来解决各种问题。
3.1.3 知识表示的概念
知识表示(knowledge representation)就是将人类知识形式化或者模型化。
知识表示的目的是能够让计算机存贮和运用人类的知识。下面先介绍常用的产生式、框架、状态空间知识表示方法,其他(如神经网络等)几种知识表示方法将在后面章节结合其应用再介绍。
3.2 产生式表示法
产生式表示法又称产生式规则(production rule)表示法。“产生式”这一术语是由美国数学家波斯特(E.Post)在 1943 年首先提出来的,如今已经被应用于多领域,成为人工智能中应用最多的一种知识表示方法。
3.2.1 产生式
产生式通常用于表示事实、规则以及它们的不确定性度量,适合于表示事实性知识和规则性知识。
1. 确定性规则的产生式表示
确定性规则的产生式表示的基本形式是
I F P T H E N Q IF\ \ \ \ P\ \ \ \ THEN\ \ \ \ Q IF P THEN Q
或者
P → Q P→Q P→Q
其中, P P P 是产生式的前提,用于指出该产生式是否可用的条件; Q Q Q 是一组结论或操作,用于指出当前提 P P P 所指示的条件满足时,应该得出的结论或者应该执行的操作。整个产生式的含义是:如果前提 P P P 被满足,则结论 Q Q Q 成立或执行所规定的操作。
例如: r 4 : I F 动物会飞 A N D 会下蛋 T H E N 该动物是鸟 r_4:\ \ \ \ IF\ \ \ \ 动物会飞\ \ \ \ AND\ \ \ \ 会下蛋\ \ \ \ THEN\ \ \ \ 该动物是鸟 r4: IF 动物会飞 AND 会下蛋 THEN 该动物是鸟
就是一个产生式。其中 r 4 r_4 r4 是该产生式的编号;“动物会飞 AND 会下蛋”是前提 P P P;“该动物是鸟”是结论 Q Q Q。
2. 不确定性规则的产生式表示
不确定性规则的产生式表示的基本形式是
I F P T H E N Q ( 置信度 ) IF\ \ \ \ P\ \ \ \ THEN\ \ \ \ Q\ \ \ \ (置信度) IF P THEN Q (置信度)
或者
P → Q ( 置信度 ) P→Q\ \ \ \ (置信度) P→Q (置信度)
例如,在专家系统 MYCIN 中有这样一条产生式:
I F 本微生物的染色斑是革兰氏阴性 A N D 本微生物的形状呈杆状 A N D 病人是中间宿主 T H E N 该微生物是绿脓杆菌 ( 0.6 ) IF\ \ \ \ 本微生物的染色斑是革兰氏阴性\ \ \ \ AND\ \ \ \ 本微生物的形状呈杆状\ \ \ \ AND\ \ \ \ 病人是中间宿主\ \ \ \ THEN\ \ \ \ 该微生物是绿脓杆菌\ \ \ \ (0.6)