16、计算机认知架构与能力现状及未来展望

计算机认知架构与未来发展

code8

于 2025-11-06 09:24:50 发布

阅读量28

点赞数

CC 4.0 BY-SA版权

分类专栏：脑启智能：从人脑到AI 文章标签：认知架构计算机能力图灵测试

本文链接：https://blog.youkuaiyun.com/code8/article/details/154672380

脑启智能：从人脑到AI 专栏收录该内容

21 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

计算机认知架构与能力现状及未来展望

1. 认知架构概述

当前的认知架构主要源于美国国防高级研究计划局（DARPA）的生物启发认知架构（BICA）第一阶段提案，不过该项目已悄然结束。目前的认知架构主要基于以下两种技术：
- 规则技术 ：技术大多基于规则构建，规则可以是“如果 - 那么”语句的形式，或者通过某种模板匹配最接近的内容并选择其作为输出。虽然规则可以自动生成，但目前强大规则的自动生成能力还有待提高。
- 符号技术 ：知识表示主要是符号化的。架构通常具有常见的记忆系统，如长期记忆、短期记忆、情感组件和推理组件。一些架构，如SOAR和ACT - R更为详细，还包括程序、情景和语义记忆。

目前，还没有一种单一的认知架构或理论能够涵盖人类认知和整个大脑的重要现象。大多数认知架构设计的研究人员表示，他们的设计在许多细节上仍不完整，仅能映射到人类大脑的大致解剖结构和功能。

2. 计算机当前的能力

计算机在这里指任何涉及计算过程的设备，如机器人、计算机系统（台式或笔记本）以及其他使用处理器的设备。下面从不同方面介绍计算机目前的能力：
- 数据和通信能力
- 数据搜索 ：在数据被正确标记或仅涉及纯关键词匹配的情况下，计算机可能比人类搜索得更快。
- 跨媒介通信 ：计算机可以自动发送文本消息，不过很多时候这些广告消息会让人厌烦。
- 类人语音 ：计算机的语音仍有明显的“机器”音色，还不能完全像人类一样说话。
- 语言翻译 ：计算机可以进行语言翻译，但准确性不如人类翻译。网络上有许多翻译引擎可供尝试。
- 印刷转录 ：对于打字文本，光学字符识别（OCR）软件可以将其图像转换为机器可读文本，准确率可达99%。手写文本识别仍是一个具有挑战性的问题，一些智能字符识别（ICR，OCR的另一种叫法）技术对“干净整齐的手写体”的识别准确率可达80% - 90%。
- 语音转文本 ：经过训练，语音转文本软件的准确率可达99%，在嘈杂环境下的语音识别软件表现也不错，网上有很多此类软件可供使用。
- 情感交流 ：语音合成器会根据标点符号产生不同的语调，但在通过语音或面部表情传达情感方面仍有不足。
- 指令理解 ：计算机只能理解简单的指令，并且这些指令必须事先经过训练。
- 物理能力
- 打乒乓球 ：Russell L. Andersson在1988年制造了一个机器人乒乓球选手。
- 类人行走和奔跑 ：目前还不完全能像人类一样。2003年，索尼QRIO成为第一个会奔跑的机器人，它还能跳舞、从跌倒中恢复并在滑板上保持平衡。2004年，本田的ASIMO机器人宣称其奔跑速度是索尼QRIO的四倍，达到每小时3公里，接近悠闲慢跑的速度。2005年，法国南特通信与控制研究所以及密歇根大学的研究人员开发出了使机器人能够像人类一样行走和奔跑并恢复平衡的数学原理，他们的机器人“Rabbit”平均步行速度为每小时5公里，奔跑速度为每小时12公里。大约在同一时间，韩国科学技术高级研究院人形机器人研究中心的Albert Hubo也展示了其机器人能够行走并进行一些简单的舞蹈动作。法国的Nao机器人可以行走、跳舞、理解语音命令、识别面孔并具有一些“用户可教”的能力。德国哥廷根大学开发的RunBot机器人能够适应不同地形，并在几次学习经验后调整姿势。不过，机器人在崎岖或丘陵地形上的移动、行走和奔跑能力仍然是一个挑战，其物理运动看起来也不够自然，这部分是由于控制机制以及物理设计中缺乏良好的形态和材料。
- 视觉能力 ：计算机还不具备不变的物体识别能力，例如在识别验证码（CAPTCHA）方面，人类仍然优于计算机。由于人类擅长物体识别，因此可以通过一个名为ESP游戏的有趣游戏为互联网上大量的图像进行标注。游戏的基本思路是显示一张图像，玩家猜测另一位玩家会为该图像使用的标签，通常的方法是输入尽可能多描述图像的词语，希望其中一个能与另一位玩家的输入匹配，这样就可以免费为所有图像进行标注。
- 艺术能力
- 绘画：机器可以画出看起来像人类绘画的作品。例如，Harold Cohen创造的机器人Aaron可以混合颜料、选择主题并绘画，他认为Aaron的创意部分在于软件。另一个绘画机器人Action Jackson则是按照创作者Topher McFarland编写的软件代码指令进行绘画。
- 唱歌：1962年，John L. Kelly和Carol C. Lochbaum使用规则合成算法让计算机演唱了歌曲“Daisy, Daisy”。
- 音乐创作 ：1997年，俄勒冈大学的音乐教授Steve Larson进行了一场音乐版的图灵测试，让观众判断三首音乐中哪首是计算机创作的，哪首是两个世纪前由约翰·塞巴斯蒂安·巴赫创作的。观众将计算机程序EMI创作的作品误认为是巴赫的作品，这表明计算机在音乐创作方面有一定的能力。
- 思维能力
- 下棋：1997年，IBM的深蓝击败了国际象棋世界冠军加里·卡斯帕罗夫。
- 数学定理证明 ：1996年，阿贡国家实验室开发的定理证明程序（EQP）证明了布尔代数中先前未解决的罗宾斯猜想。
- 导航：如今，GPS引导的导航系统非常强大、快速且准确，当人类走错路时，它可以重新计算替代路线。安装了这样的系统和语音识别系统后，在高速公路或乡村道路上驾驶变得轻松。
- 情感方面 ：目前计算机没有情感，但有关于构建具有情感学习能力机器的研究，未来机器可能会“看起来”有情感。例如，麻省理工学院的机器人Kismet被设计成具有一些“类人”的表情，可以“表达”如快乐、悲伤、兴趣、厌恶、惊讶、愤怒和平静等情绪。
- 理解能力 ：计算机不太能理解自己所说的内容，也不能很好地理解人类的话语，可能打字输入让计算机“理解”会更容易。
- 预见能力 ：目前计算机没有心理预见能力。
- 情感理解 ：计算机目前无法理解他人的情感状态。
- 感受能力 ：我们还不完全了解大脑如何产生感受，所以计算机目前没有感受能力。
- 教学能力 ：计算机还不能根据学生的学习风格进行教学。

3. 计算机能力的局限性

虽然计算机在某些方面表现出色，但在许多领域仍存在明显的局限性：
- 一般任务能力
- 知识讨论 ：计算机目前还不能很好地讨论艺术、科学、技术和历史等话题，也不能以恰当的方式回答问题，更难以与人类展开讨论。不过，随着本体论和知识表示研究的进展，计算机可能能够回答结构良好且其有丰富本体表示的问题。
- 个人经验和社交关系 ：计算机目前无法拥有个人经验并讨论社交关系。
- 游戏学习 ：计算机目前还不能普遍学习玩各种游戏，如乒乓球、羽毛球、高尔夫和足球等。
- 类人思维 ：计算机距离像人类一样思考还有很长的路要走。
- 语言理解 ：计算机语言理解仍然是一项复杂的任务。
- 创造力 ：目前机器还不能展示出真正的创造力。
- 视觉能力匹配 ：计算机视觉在识别不同空间方向、大小、亮度等情况下的物体方面，还无法与人类能力相匹配。
- 自由意志 ：计算机没有像人类一样的自由意志。不过，如果对自由意志进行定义，机器可能在这个定义范围内实现某种程度的自由意志。而且，机器的自由度越高，就越需要道德标准。由于计算机对潜在危害人类事件的感知并不完美，且计算机可能被人类或其他计算机黑客攻击，所以很难为计算机执行“三大法则”。一个真正在复杂和不可预测环境中运行的系统，不仅需要法则，还需要价值观、原则和道德指引，甚至可能需要宗教。
- 性格：计算机是否能拥有性格仍不确定。
- 社交互动 ：目前计算机在社交和与人类互动方面还不够完善。
- 应对意外 ：计算机擅长执行预先编程的任务，而人类大脑能够实时应对和处理意外情况，这是目前计算机所不具备的能力。DARPA的“神经形态自适应可塑性可扩展电子系统”（SyNAPSE）项目旨在开发一种模仿生物皮层功能、大小和功耗的大脑启发式电子“芯片”，其中一个任务就是能够应对意外情况。
- 自我生成 ：目前汽车生产工厂中的多个机器人都是预先编程的，其生产过程是固定的，机器还不能像生物一样自我生成新的机器。

4. 图灵测试与计算机的未来

图灵测试的概念 ：1950年，艾伦·图灵发表了一篇论文，描述了他的图灵测试概念。在测试中，一个或多个人类评委通过终端与计算机和人类进行交流（这样评委不会因为计算机没有人类外观而产生偏见），对话性质类似于即时通讯的在线聊天。计算机和人类都试图让人类评委相信自己是人类。如果人类评委无法可靠地识别出计算机，那么就认为计算机展示了人类水平的智能。但是图灵对于测试的许多方面并没有明确说明，例如审讯的持续时间、人类评委和人类参与者的专业程度等。
图灵的预测 ：一般认为图灵预测从1950年起50年内，即2000年计算机能通过图灵测试，但Jack Copeland认为这是一个非官方的预测日期。Copeland分享了图灵在1952年与新闻记者的对话，图灵表示计算机通过图灵测试至少需要100年。
不同观点和相关竞赛
- 观点多样 ：对于计算机何时能通过图灵测试，人们有不同的观点。
- 相关竞赛
  - 勒布纳人工智能奖 ：这是第一个图灵测试竞赛，商人Hugh Loebner出资10万美元奖励第一个通过测试的计算机，每年还会举办有较小奖金的竞赛。2007年的竞赛在纽约市举行，ALICE是2004年勒布纳奖的获得者。
  - AAAI竞赛 ：Mitchell Kapor和Raymond Kurzweil进行了一场长期打赌，主题是到2029年是否会有计算机（或“机器智能”）通过图灵测试。截至2007年5月的投票结果是，53%的人不同意，47%的人同意。
各方言论
- David Gelernter认为通过软件构建有意识的机器是不可能的，目前实现意识的唯一途径是通过生物有机体。
- Raymond Kurzweil认为信息技术的指数级增长将影响硬件和软件，20年内将对大脑的各个认知区域进行建模和模拟，这将为构建智能机器通过图灵测试提供模板。他还表示，根据加速回报定律（摩尔定律的一种变体）带来的计算能力的指数级增长，人类将能够不断快速提高非侵入性大脑扫描技术的分辨率和速度，从而构建一个新的“大脑”。不过，加速回报定律只有在量子计算实现的情况下才能实现，而目前量子计算的发展现状还不确定，且戈登·摩尔在2005年表示，由于晶体管可能达到原子级别的小型化极限，该定律可能不会持续太久。
- Copeland认为未来50年计算机通过图灵测试的机会很大。
- Ben Goertzel相信在10年内，甚至可能在3 - 5年内，有可能创建出超人类智能的AI系统。
- Marvin Minsky认为人工智能进展有限的原因是没有开发出复杂的思维模型，需要更好的编程语言和架构，并且没有关注普通儿童都能解决的常识问题。
- John Searle认为计算机程序只是语法层面的，而思维不仅仅是语法，还具有语义内容。

虽然目前计算机在许多方面取得了一定的进展，但距离实现全面的人类认知智能还有很长的路要走。不过，随着研究的不断深入和技术的不断发展，未来计算机的能力有望得到进一步提升。下面用mermaid流程图展示计算机能力发展的大致过程：

graph LR
    A[当前计算机能力] --> B[数据和通信能力]
    A --> C[物理能力]
    A --> D[视觉能力]
    A --> E[艺术能力]
    A --> F[思维能力]
    B --> B1[数据搜索]
    B --> B2[跨媒介通信]
    B --> B3[类人语音]
    B --> B4[语言翻译]
    B --> B5[印刷转录]
    B --> B6[语音转文本]
    B --> B7[情感交流]
    B --> B8[指令理解]
    C --> C1[打乒乓球]
    C --> C2[类人行走和奔跑]
    D --> D1[物体识别]
    E --> E1[绘画]
    E --> E2[唱歌]
    E --> E3[音乐创作]
    F --> F1[下棋]
    F --> F2[数学定理证明]
    F --> F3[导航]
    F --> F4[情感方面]
    F --> F5[理解能力]
    F --> F6[预见能力]
    F --> F7[情感理解]
    F --> F8[感受能力]
    F --> F9[教学能力]
    A --> G[能力局限性]
    G --> G1[一般任务能力局限]
    G --> G2[自由意志等局限]
    A --> H[图灵测试与未来]
    H --> H1[图灵测试概念]
    H --> H2[图灵预测]
    H --> H3[不同观点和竞赛]
    H --> H4[各方言论]

总之，计算机在认知架构和各种能力方面既有成就也有不足，未来的发展充满挑战和机遇，我们期待看到计算机在人工智能领域取得更大的突破。

计算机认知架构与能力现状及未来展望

5. 认知架构发展的挑战与潜力

当前认知架构虽然有一定进展，但面临诸多挑战。规则技术中，规则的自动生成虽可行，但生成健壮规则的能力仍需提升。例如在复杂场景下，自动生成的规则可能无法准确应对各种情况。符号技术方面，尽管架构有多种记忆系统，但大多仅能映射到人类大脑的大致解剖结构和功能，对于大脑精细的认知机制还远远未能模拟。

不过，认知架构也具有巨大潜力。随着神经科学研究的深入，对大脑工作原理的理解会更加透彻，这将为认知架构的设计提供更准确的参考。例如，如果能够明确大脑中某些特定认知功能对应的神经回路，就可以将其应用到认知架构的设计中，使架构更加贴近人类认知。

6. 计算机能力提升的关键因素

计算机能力的提升依赖于多个关键因素，以下是详细分析：
- 硬件性能 ：硬件是计算机运行的基础，其性能直接影响计算机的处理速度和效率。例如，CPU的运算速度、内存的大小和读写速度、硬盘的存储容量和读写速度等都会对计算机的整体性能产生影响。随着技术的发展，量子计算若能取得突破，将极大地提升计算机的计算能力。目前，传统计算机的晶体管尺寸逐渐接近原子级别，面临着物理极限，而量子计算利用量子比特的特性，可以实现并行计算，从而大幅提高计算速度。
- 软件算法 ：优秀的软件算法可以充分发挥硬件的性能，提高计算机的处理能力。例如，在图像识别领域，深度学习算法的出现使得计算机对图像的识别准确率大幅提高。通过不断优化算法结构和参数，可以提高算法的效率和准确性。
- 数据资源 ：丰富的数据资源是计算机学习和训练的基础。例如，在自然语言处理中，大量的文本数据可以用于训练语言模型，使其能够更好地理解和生成自然语言。同时，数据的质量也至关重要，准确、全面、有代表性的数据可以提高计算机的学习效果。
- 跨学科研究 ：计算机科学与神经科学、心理学、生物学等学科的交叉研究，可以为计算机能力的提升提供新的思路和方法。例如，借鉴神经科学中大脑的神经网络结构和工作原理，可以设计出更加高效的人工智能算法。

7. 未来计算机发展的趋势

未来计算机的发展将呈现以下趋势：
- 智能化程度提高 ：计算机将越来越接近人类的智能水平，能够更好地理解人类的语言和行为，实现更加自然的人机交互。例如，智能语音助手将能够更加准确地理解用户的意图，提供更加个性化的服务。
- 与人类生活深度融合 ：计算机将广泛应用于各个领域，与人类的生活紧密相连。例如，智能家居系统可以通过计算机控制家电设备，实现自动化和智能化；智能医疗设备可以实时监测人体健康状况，并提供相应的诊断和治疗建议。
- 具备情感和意识 ：虽然目前计算机还没有情感和意识，但随着研究的深入，未来计算机可能会具备一定的情感和意识。例如，机器人可以通过情感识别技术理解人类的情感状态，并做出相应的反应。
- 群体协作能力增强 ：多台计算机或机器人可以通过网络进行协作，共同完成复杂的任务。例如，在物流领域，多个机器人可以协同工作，实现货物的高效运输和仓储管理。

8. 应对计算机发展挑战的策略

为了应对计算机发展过程中面临的挑战，可以采取以下策略：
- 加强基础研究 ：加大对计算机科学、神经科学、心理学等基础学科的研究投入，深入探索人类认知和智能的本质，为计算机能力的提升提供理论支持。
- 促进跨学科合作 ：鼓励不同学科之间的交流与合作，打破学科壁垒，整合各学科的优势资源，共同攻克计算机发展中的难题。
- 培养专业人才 ：加强计算机相关专业的教育和培训，培养具有创新能力和跨学科知识的专业人才，为计算机行业的发展提供人才保障。
- 建立道德和法律规范 ：随着计算机技术的发展，会带来一系列的道德和法律问题，如隐私保护、人工智能的责任认定等。因此，需要建立相应的道德和法律规范，引导计算机技术的健康发展。

下面用mermaid流程图展示计算机发展挑战与应对策略的关系：

graph LR
    A[计算机发展挑战] --> B[硬件物理极限]
    A --> C[软件算法瓶颈]
    A --> D[数据质量和安全问题]
    A --> E[跨学科融合困难]
    B --> F[加强硬件技术研究]
    C --> G[优化软件算法设计]
    D --> H[提高数据管理水平]
    E --> I[促进跨学科合作]
    F --> J[量子计算研究]
    G --> K[深度学习算法优化]
    H --> L[数据清洗和加密]
    I --> M[跨学科项目合作]
    J --> N[应对硬件挑战]
    K --> N
    L --> N
    M --> N
    N --> O[推动计算机发展]

总之，计算机的发展是一个充满挑战和机遇的过程。我们需要充分认识到计算机目前的能力和局限性，抓住关键因素，顺应发展趋势，采取有效的应对策略，以推动计算机技术不断向前发展，实现计算机全面的人类认知智能，为人类社会带来更多的便利和福祉。