人工智能中的常识探索
1. 研究背景与方向
在人工智能领域,研究方向的探讨一直存在激烈的争论。一些近期的书籍对相关研究方法产生了影响。Judea Pearl(与Dana Mackenzie)所著的《为什么:关于因果关系的新科学》让人们相信,为普通读者撰写一本包含小型技术示例的人工智能书籍是可行的。而Brian Cantwell Smith在2019年出版的《人工智能的承诺》则促使人们深入思考人工智能研究背后的哲学问题。
此外,许多非人工智能领域的人撰写的文章也推动了相关研究。如今,在杂志和报纸的科技或商业板块中,经常能看到关于人工智能现状的评论。例如,1982年科学作家Gina Kolata的文章《计算机如何获得常识?》对常识进行了早期报道。社会学家Harry Collins的《人工智能》以及科技记者Tim Cross在2020年发表于《经济学人》的文章《对人工智能局限性的认识开始深入人心》,都是对人工智能的重要批判。
在人工智能研究方向的争论中,我们不打算参与辩论,而是探索一条通往常识的特定道路,以更好地理解这一过程。具体步骤如下:
1. 研究人类的常识(后续会详细探讨)。
2. 了解人工智能系统的历史,包括深度学习的发展。
3. 探究使用符号的思想来源以及背后的科学假设。
4. 详细研究这一假设。
5. 尝试将其与实际的常识行为建立联系。
6. 思考如何将这些想法付诸实践以及为什么要这样做。
2. 人类的常识
常识长期以来一直是大众讨论的话题,但却难以进行详细解释。有时,它被用作良好判断力或逻辑思维的代名词。然而,很难找到对人类常识的明确描述,人们更多地是对其使用场景和共性进行猜测,而对其本质却知之甚少。
目前,关于人类常识现象的科学研究较少,这可能是因为难以明确区分常识与其他更专业的思维模式。Daniel Kahneman在《思考,快与慢》中提出的系统1和系统2的区分,是理解人类心理学的一种有用方式,但与常识的概念有所不同。有趣的是,Kahneman的书中甚至没有将“常识”列入索引。
在心理学领域,与常识直接相关的最主要研究方向是实践智力。Robert Sternberg及其同事发表了一系列相关出版物,包括《日常生活中的实践智力》,Sternberg的合作者Jennifer Hedlund也有一篇名为《实践智力》的综述。Sternberg在2021年出版的《适应性智力》中涵盖了更广泛的适应性智力理论。文献中关于实践智力的讨论大多围绕测量展开,这主要是因为人们对智商测试所测量的单一“一般智力”因素g不满意。此外,关于常识是否可以传授也存在疑问,有一些指南和网站声称可以解释如何提高实践智力,这些讨论的见解可能最终对人工智能有价值。
Kenneth Hammond关于认知连续体的研究始于1980年,他在1987年与同事共同撰写的文章《专家判断中直觉和分析认知效能的直接比较》是一个很好的例子。Hammond认为,直觉认知模式是图像化的,而分析模式则更倾向于语言化。有证据表明,更具分析性的能力由人类大脑的前额叶皮层处理,而控制日常自动活动的则是杏仁核和小脑。颞叶作为记忆的中心,可能对人类常识很重要,但相关的神经科学研究还有待进一步开展。
哲学家有时会区分关注世界真相的推理和关注应采取行动的实践推理。Elijah Millgram编辑的《实践推理的多样性》提供了关于这一主题的多种观点。Steven Pinker在2021年出版的《理性》则对理性这一话题进行了探讨。
社会学家Duncan Watts在《一切显而易见》中对常识进行了有用的阐述。我们同意他的许多观点,例如他强调基于经验的快速、简单解释以及常识的实用性。但在两个关键问题上存在分歧:
1. 我们认为,要表现出常识,必须能够有效利用经验知识来实现目标,而Watts更侧重于知识本身,我们认为推理方面同样重要。
2. Watts推测,常识的实用性意味着无需理解为什么某件事是常识性的,而我们认为,至少要有一种直觉上的理解,并能够剖析其背后的知识。
此外,还存在一些与常识不同的思维方式:
1. 专家会获得需要复杂分析思维的专业知识,但他们也往往会对自己的专业领域形成更直观的理解,类似于同行群体共享的一种常识。心理学家Gary Klein在《直觉的力量》中谈到了专家的直觉决策以及专家使用直觉而非理性有序分析做出关键决策的频率。
2. 谜题模式思维,HJL在1988年的论文《逻辑与推理的复杂性》中对这一概念进行了初步分析。
3. 模式识别,例如在字母线性序列中识别模式,计算机科学家Mikhail Bongard提出的涉及二维视觉结构的相关任务,在Melanie Mitchell的《人工智能》一书中有详细讨论。
3. 人工智能系统的专业知识
人工智能系统和项目种类繁多。Pamela McCorduck的《会思考的机器》和Nils Nilsson的《人工智能的探索》都对人工智能的历史进行了介绍。2005年和2006年《人工智能杂志》的特刊(由David Leake编辑)对该领域进行了回顾,后者纪念了人工智能领域诞生50周年。2020年该杂志的一期(由Ashok Goel编辑)则对美国国防部高级研究计划局(DARPA)资助的研究人员的重要贡献进行了调查。
早在20世纪40年代末,Alan Turing就对机器智能进行了重要的思考。他提出的模仿游戏(即图灵测试),尽管存在优缺点,但推动了早期人工智能的思考。HJL的《常识》以及Gary Marcus、Francesca Rossi和Manuela Veloso在2016年发表于《人工智能杂志》的特刊,都对图灵测试提供了见解。此外,Turing在1953年的文章《数字计算机在游戏中的应用》中,还探讨了计算机在战略游戏中的应用,这是基于Claude Shannon的《编程计算机下棋》的工作。
许多人认为人工智能领域始于1956年在新罕布什尔州举行的达特茅斯夏季研究项目。John McCarthy、Marvin Minsky、Nathaniel Rochester和Shannon在1955年8月31日提交给洛克菲勒基金会的提案中,前瞻性地谈到了许多至今仍是该领域核心的话题,包括使用抽象和概念进行推理、学习(包括神经网络)、创造力、问题解决和游戏等。实际上,Allen Newell、Herb Simon和Cliff Shaw在达特茅斯会议前一年就开始研究名为“逻辑理论家”的人工智能程序。1956年初,Simon曾对他的一个班级说:“在圣诞节假期,Al Newell和我发明了一台会思考的机器。”
游戏和与游戏相关的搜索在人工智能历史中一直扮演着重要角色。Newell和Simon在他们的图灵奖演讲《计算机科学作为经验探究》中提出了关于搜索的观点。在跳棋方面,John McCarthy和Ed Feigenbaum在Arthur Samuel去世后发表的文章《机器学习先驱》对他的贡献进行了评价。Jonathan Schaeffer在2007年发表于《科学》的文章《跳棋已被解决》记录了他在跳棋领域的胜利。深蓝在国际象棋上的成功更为人所知,例如Monty Newborn的《深蓝》对此进行了介绍。Hans Berliner的《西洋双陆棋计算机程序击败世界冠军》和Noam Brown与Tuomas Sandholm的《单挑无上限德州扑克的超人人工智能》分别描述了西洋双陆棋和扑克领域的人工智能成功案例。
在自然语言处理(NLP)方面,Terry Winograd在1972年发表于《认知心理学》的麻省理工学院论文《理解自然语言》是早期NLP的一个里程碑。同时,William Woods的《自然语言分析的转换网络语法》等其他重要工作也在进行中。Robert Simmons在1965年的文章《计算机回答英语问题》对多个问答系统进行了调查。Daniel Jurafsky和James Martin撰写的《语音与语言处理》是一本关于NLP的最新教科书,并不断更新。Mark Liberman和Charles Wayne在《人类语言技术》中对语音识别和语音理解进行了全面回顾。HJL、Ernest Davis和Leora Morgenstern在2012年的论文《Winograd模式挑战》引发了对Winograd模式的关注,HJL的《常识》也进一步讨论了这一话题。
基于规则的系统的早期先驱是Minsky编辑的《语义信息处理》,其中收录了几位使用符号知识支持人工智能的先驱的博士论文。Frederick Hayes - Roth、Donald Waterman和Douglas Lenat的《构建专家系统》以及Peter Jackson的《专家系统导论》对专家系统进行了详细描述。Edward Shortliffe的《基于计算机的医疗咨询》介绍了MYCIN系统,Victor Yu及其同事在1984年发表的《对MYCIN建议的评估》对MYCIN在治疗传染性脑膜炎方面的能力进行了正式评估,在双盲两阶段评估中,其建议的可接受率高于七名医生和一名医学生。Richard Duda、John Gaschnig和Peter Hart在《探矿者顾问系统在矿产勘探中的模型设计》中介绍了探矿者系统,John McDermott在《R1:基于规则的计算机系统配置器》(原名R1)以及Judith Bachant和Elliot Soloway的《XCON的工程设计》中介绍了XCON系统。Melanie Mitchell在《人工智能》中提到了专家系统的脆弱性。
在集成系统方面,1970年Brad Darrach在《生活》杂志上发表的长篇文章首次向公众介绍了机器人Shakey,文章标题《见见Shaky,第一个电子人》对Shakey进行了富有挑衅性的描述,并声称它有“自己的思想”。大约三十年后,Wolfram Burgard及其同事在《交互式博物馆导游机器人的经验》中介绍了博物馆导游机器人。Sebastian Thrun及其团队在《斯坦利:赢得DARPA大挑战的机器人》中详细记录了2005年赢得DARPA无人驾驶挑战赛的汽车。Nicola Muscettola及其同事在《远程代理》中讨论了深空一号上的人工智能系统。Minoru Asada等人在1999年的文章《机器人世界杯》以及Asada和Oskar von Stryk在《机器人世界杯的科学和技术挑战》中描述了机器人世界杯比赛。John Laird在2019年出版的《Soar认知架构》介绍了Soar架构。RJB、David Gunning和Murray Burke在《集成人工智能系统》中对其他机器人和非机器人集成人工智能系统进行了调查。HJL和Gerhard Lakemeyer的《认知机器人学》对专注于认知方面的机器人研究进行了综述。
值得注意的是,新闻报道或纪录片中展示的类人机器人大多与人工智能关系不大,它们更注重外观而非实际能力,甚至可能由隐藏在一旁的人类远程操作,这种传统可以追溯到18世纪70年代的下棋自动机(著名的如“土耳其行棋傀儡”)。
如今,数据驱动的学习,尤其是神经网络建模,已成为人工智能的主导力量。Yann LeCun、Yoshua Bengio和Geoffrey Hinton在《自然》杂志上发表的《深度学习》是了解深度学习的权威文章。Md Zahangir Alom及其同事的《深度学习理论和架构的最新研究综述》进行了更广泛的调查,其中提到了许多微软、IBM、谷歌等公司的应用。Jeff Dean关于深度学习对语音工作影响的观点在Mitchell的《人工智能》第180页有报道。Christopher Shallue和Andrew Vanderburg在《利用深度学习识别系外行星》中讨论了深度学习在天文学中的应用。Farhad Manjoo在2020年7月29日发表于《纽约时报》的专栏文章《你怎么知道这是人类写的?》对GPT - 3进行了讨论。Marcus在预印本《人工智能的下一个十年》中给出了GPT - 2变压器输出的希腊语示例。David Silver等人在《自然》杂志上发表的《利用深度神经网络和树搜索掌握围棋》描述了基于深度学习的围棋方法。François Chollet在2019年的预印本《论智能的衡量》中提到了深度学习的局限性,其他研究人员也有类似的担忧。这里引用的“下一部小说”是John Levesque的《日内瓦告别》。英国国家语料库的信息可以在http://www.natcorp.ox.ac.uk/ 上找到,Ernest Davis指出该语料库中存在大量罕见词汇,这种长尾分布对常识的影响在HJL的《常识》第7章中进行了讨论。
3. 知识及其表示
知识的研究可以追溯到古希腊时期,一直是哲学研究的重要内容。A. Phillips Griffiths的《知识与信念》和Michael Roth与Leon Galis的《认识》是该领域的两本论文集。哲学家Jaakko Hintikka在《知识与信念》中对知识进行了开创性的数学分析,这一工作在计算机科学中得到了进一步应用,例如Ronald Fagin及其同事的《关于知识的推理》。HJL和Gerhard Lakemeyer的《知识库的逻辑》则强调了知识在知识库中的符号表示。
逻辑是一个庞大的主题,包含许多不同的概念,难以简单概括。对于我们的研究,我们主要关注西方古典传统中的演绎逻辑,如Alex Malpass和Marianna Antonutti Marfori编辑的《哲学与形式逻辑史》中所述。现代形式的符号逻辑归功于Gottlob Frege,而特定的符号表示则由数学家Giuseppe Peano提出。20世纪初的关键发展是建立了一个形式系统,该系统不仅包括“与”“或”“非”等句子级运算符(即早期逻辑学家George Boole提出的布尔运算符),还首次引入了带参数的谓词、变量和量词,这些内容将在后续进一步讨论。
David Olson的《纸上的心灵》探讨了单词等符号对人类思维过程的重要性,尤其是通过阅读和写作。Gottfried Leibniz是研究单词和数字等表示形式的早期先驱,他在1677年《通用科学前言》中的引用明确提到了我们现在所说的符号处理,但对这一概念(与算术不同)的实际描述直到近三百年后John McCarthy、Allen Newell等人的工作才出现。例如,McCarthy在1960年的论文《符号表达式的递归函数及其机器计算,第一部分》中进行了相关探讨。甚至逻辑学家Kurt Gödel在20世纪30年代对逻辑语言公式的处理,也是通过将这些公式映射到数字(即所谓的哥德尔编码)以算术形式进行的。
John McCarthy在1958年的论文《具有常识的程序》中对常识进行了阐述。知识表示假设引自Brian Cantwell Smith的博士论文《过程语言中的反射与语义》,这一想法通常归功于McCarthy,但其他人工智能研究人员也有类似的思路。Allen Newell和Herb Simon更强调符号方面,他们在1976年的论文《计算机科学作为经验探究》中提出了物理符号系统假设:“物理符号系统具有实现一般智能行为的必要和充分手段。”
McCarthy在1977年的文章《人工智能的认识论问题》中讨论了基于知识的系统在认识论和启发式方面的充分性。许多关键人物沿着McCarthy的道路,使用逻辑公式来表示常识性知识。例如,Ernest Davis在1990年出版的《常识知识的表示》、Joseph Halpern在2017年出版的《不确定性推理》、Jerry Hobbs和Robert Moore在1985年出版的《常识世界的形式理论》以及Raymond Reiter在2001年出版的《行动中的知识》。Matthew Ginsberg编辑的《非单调推理读物》探讨了将默认和典型性等概念纳入逻辑扩展的必要性。Minsky在1985年的论文《知识表示框架》第262页提到了逻辑推理的不足。
Cyc可能是人工智能领域持续时间最长的项目,但也是最具争议的项目之一。争议并非源于其雄心勃勃的目标,而是由于关于它的信息极度匮乏。虽然有一些关于Cyc的同行评审出版物,如Cynthia Matuszek及其同事的《寻找常识》和Michael Witbrock及其同事的《Cyc中的交互式知识获取对话系统》,但对于一个有三十五年历史的大型研究项目来说,这些出版物相对较少。Douglas Lenat和Ramanathan Guha的《构建大型知识库系统》可能是最全面的描述,但它被视为“中期报告”,没有反映1989年之后的工作。许多关于Cyc的说法仅出现在流行杂志上,例如Lenat在2019年7月在线版《福布斯》上发表的文章《人工智能可以从罗密欧与朱丽叶中学到什么》。Lenat关于“启发式推理模块”的引用就来自这篇文章。几乎所有关于该项目的信息都由项目和公司领导严格控制,例如Cyc实际规模的说法来自Cyc网站,尚未得到独立证实。Ernest Davis和Gary Marcus在《美国计算机协会通讯》的文章《人工智能中的常识推理和常识知识》中对这种情况进行了评论。
综上所述,我们对人工智能中常识的研究涵盖了人类常识、人工智能系统历史、知识表示等多个方面。通过对这些内容的探索,我们希望能够更好地理解常识在人工智能中的作用,并为未来的研究提供有益的参考。未来,我们还需要进一步深入研究如何将这些理论应用到实际的人工智能系统中,以实现更具常识的智能行为。
4. 研究方法与关键假设
在探索人工智能中的常识时,有几个关键的研究方法和假设起到了重要作用。以下是这些方法和假设的详细介绍:
4.1 知识表示假设
- 起源与定义 :知识表示假设通常归功于John McCarthy,但Brian Cantwell Smith在其博士论文中也有相关阐述。该假设认为,知识可以通过符号进行表示,并且这种表示能够支持智能行为。
- 不同版本 :Allen Newell和Herb Simon提出的物理符号系统假设强调了符号在智能行为中的核心地位,认为物理符号系统具有实现一般智能行为的必要和充分手段。
4.2 逻辑与推理
- 演绎逻辑 :西方古典传统中的演绎逻辑是研究的重要基础,现代符号逻辑由Gottlob Frege发展而来,引入了谓词、变量和量词等概念,为知识的精确表示和推理提供了工具。
- 非单调推理 :为了处理常识中的不确定性和默认情况,需要对逻辑进行扩展,引入非单调推理的概念。Matthew Ginsberg编辑的《非单调推理读物》对此进行了探讨。
4.3 符号处理
- 重要性 :符号处理是人类思维和人工智能的关键环节。Gottfried Leibniz是早期研究符号表示的先驱,David Olson的研究也强调了符号对人类思维的重要性。
- 发展历程 :从早期的算术处理到后来John McCarthy等人对符号表达式的递归函数的研究,符号处理的概念逐渐明确和完善。
下面是一个简单的mermaid流程图,展示了知识表示、逻辑推理和符号处理之间的关系:
graph LR
A[知识表示] --> B[逻辑推理]
A --> C[符号处理]
B --> D[智能行为]
C --> D
5. 人工智能系统的发展与挑战
5.1 发展历程回顾
人工智能系统的发展经历了多个阶段,从早期的基于规则的系统到如今的数据驱动的深度学习系统。以下是一些重要的发展节点:
| 时间 | 事件 |
| ---- | ---- |
| 20世纪40年代末 | Alan Turing提出图灵测试,推动了早期人工智能的思考 |
| 1956年 | 达特茅斯会议标志着人工智能领域的诞生 |
| 1972年 | Terry Winograd的《理解自然语言》成为早期NLP的里程碑 |
| 20世纪80年代 | 专家系统如MYCIN、探矿者、XCON等得到发展 |
| 21世纪初 | 深度学习开始兴起,成为人工智能的主导力量 |
5.2 面临的挑战
尽管人工智能取得了显著进展,但仍然面临着许多挑战:
-
常识理解
:如何让人工智能系统具备真正的常识理解能力,是当前研究的难点之一。人类的常识是复杂而微妙的,难以用简单的规则或数据来表示。
-
鲁棒性和可解释性
:现有的人工智能系统往往缺乏鲁棒性,在面对复杂环境和未知情况时容易出错。同时,系统的决策过程往往难以解释,这限制了其在一些关键领域的应用。
-
数据质量和偏见
:数据驱动的学习依赖于大量的数据,但数据的质量和偏见问题可能会影响模型的性能和公正性。
5.3 应对策略
为了应对这些挑战,研究人员提出了一些策略:
-
多模态学习
:结合多种模态的数据,如图像、语音、文本等,以提高系统的常识理解能力。
-
可解释人工智能
:开发可解释的模型和算法,使系统的决策过程更加透明和可理解。
-
数据清洗和增强
:对数据进行清洗和增强,减少数据中的噪声和偏见,提高数据的质量。
6. 未来展望
6.1 研究方向
未来,人工智能中常识的研究可能会朝着以下几个方向发展:
-
跨学科研究
:结合哲学、心理学、认知科学等多个学科的知识,深入理解人类常识的本质,为人工智能的发展提供更坚实的理论基础。
-
融合多种技术
:将知识表示、逻辑推理、深度学习等多种技术相结合,开发更加智能和灵活的人工智能系统。
-
应用拓展
:将具有常识的人工智能系统应用到更多领域,如医疗、交通、教育等,为社会带来更多的价值。
6.2 潜在影响
具有常识的人工智能系统的发展可能会对社会产生深远的影响:
-
提高生产效率
:在工业、农业等领域,人工智能系统可以帮助人们更高效地完成任务,提高生产效率。
-
改善生活质量
:在医疗、教育等领域,人工智能系统可以提供更加个性化的服务,改善人们的生活质量。
-
引发伦理和社会问题
:随着人工智能的发展,也可能会引发一些伦理和社会问题,如隐私保护、就业结构变化等,需要我们提前做好应对准备。
总之,人工智能中的常识研究是一个充满挑战和机遇的领域。通过对人类常识的深入理解和对人工智能技术的不断创新,我们有望开发出更加智能、更加人性化的人工智能系统,为人类社会的发展做出更大的贡献。
超级会员免费看

被折叠的 条评论
为什么被折叠?



