Google DeepMind联合创始人兼CEO,神经科学家德米斯·哈萨比斯(Demis Hassabis),被誉为AI时代的领军人物。他以科学家严谨的态度和产品家的敏锐洞察力,对当前AI的竞赛格局、未来一年的技术突破方向,以及最具争议的通用人工智能(AGI)的实现路径,给出了坦率且毫不妥协的见解。哈萨比斯的对话揭示了AI行业正处于一个前所未有的加速期,技术焦点正从纯粹的语言模型转向多模态融合、世界模型和自主智能体,同时,他也强调了应对AGI带来的潜在风险和巨大社会变革的紧迫性。
科学至上:DeepMind的制胜哲学
哈萨比斯将自己定位为“科学家优先”,并认为科学方法论是DeepMind取得优势的核心所在。他指出,科学方法(包括实验和根据证据更新假设)不仅适用于基础研究,更可以应用于日常生活和商业领域。
- 科学方法的价值:科学方法被认为是人类拥有的最重要思想,它创造了启蒙运动和现代科学,是现代文明的基石。
- 严谨性与优势:在当前科技界“最激烈的竞争”中,DeepMind之所以能够保持优势,是因为其工作核心拥有科学方法的严谨性与精确性。
- 三重能力融合:站在AI前沿需要整合三项世界级的核心能力:世界级的研究、世界级的工程,以及世界级的基础设施。
哈萨比斯也正是基于这种科学的实用主义态度,才得以做出关键的战略调整。他提到,在2017年至2018年,DeepMind内部拥有多种研究路径(包括基于AlphaGo的纯强化学习系统、认知科学模型以及语言模型Chinchilla等)。当大规模语言模型(LLM)显示出惊人的潜力时,哈萨比斯抛弃了对现有理论的执着,果断地将更多资源投入到LLM研究分支,因为真正的科学家必须遵循经验证据指引的方向。
未来12个月:AI前沿的“三大支柱”
在对未来12个月的AI进展进行预测时,哈萨比斯摒弃了炒作,给出了三项最具确定性的技术趋势。
1. 多模态融合的爆发式理解力
多模态的融合是DeepMind重点突破的方向。他们的基础模型Gemini从一开始就被设计为多模态,能够处理图像、视频、文本和音频输入,并能生成相应类型的输出。
- 跨模态理解:多模态带来的最大优势是跨模态的交叉融合,使模型具备惊人的视觉理解能力。例如,他们的最


最低0.47元/天 解锁文章
3153






