大家好,我是努力学习AI算法的超级驼鹿,其实留言板中的很多小伙伴还是不清楚AI、机器学习、深度学习这三者之间的关系,所以今天这篇文章和大家聊聊邱锡鹏老师《神经网络与深度学习》一书中关于人工智能、机器学习与深度学习的核心概念及其关联,有些是邱老师书中的解释,而有些则是超级驼鹿个人的理解。
---------------------------------------------------------------------------------------------------------------------------------
总述:
其实简单来说,AI是一个大领域,只要是任何研究让计算机模拟人类智能行为的科学都可以归到人工智能这个大领域;而机器学习可以看作是人工智能的实现方式,其本质就是想让计算机自己发现一些规律,而深度学习则是机器学习的进化版,他可以省去机器学习中特征工程的部分,自动的从样本中学习特征,深度学习需要解决的问题是“贡献值分配”的问题,也就是那些东西对于最后的结果应该占主导作用?哪些应该不占很大的作用?而神经网络则是目前为止解决贡献度分配问题最好的方式。
---------------------------------------------------------------------------------------------------------------------------------
一、人工智能:从图灵测试到三大流派
人工智能(AI)是研究如何让计算机模拟人类智能行为的学科,其终极目标是构建能够通过图灵测试的智能系统(即人类无法通过对话区分对方是机器还是人)。邱老师在书中提到,AI的发展历经符号主义、联结主义和行为主义三大流派:
1. 符号主义:基于逻辑规则和知识表示(如专家系统),强调推理能力;
2. 联结主义:以神经网络为核心,通过模拟生物神经元连接实现学习和适应(当前主流的深度学习即属于此流派);
3. 行为主义:关注智能体与环境的交互,通过强化反馈优化行为策略(如机器人控制)。
近年来,以深度学习为代表的联结主义成为推动AI技术突破的核心力量,例如AlphaGo的胜利和ChatGPT的生成能力均依赖深度神经网络。
---------------------------------------------------------------------------------------------------------------------------------
二、机器学习:AI的“学习方法论”
机器学习(ML)是实现AI的关键路径,其核心是让计算机从数据中自动学习规律,而非依赖人工规则编程。邱老师书中强调,机器学习的本质是优化问题,包含三大要素:
1. 模型:如线性回归、决策树、神经网络等;
2. 学习准则:通过损失函数(如交叉熵、平方损失)衡量预测误差;
3. 优化算法:如梯度下降法及其变种(随机梯度下降、小批量梯度下降)。
但我个人还想加入两个部分到这三大要素里:分别是0.数据 和 4.评估
也就是说数据的表示形式、模型的选择与假设、学习准则、优化算法以及模型的评价标准是超级驼鹿认为机器学习的五大要素、同时也是整个机器学习与深度学习的数学上/代码上应该按顺序解决的流程
机器学习任务可分为:
- 监督学习:数据含标签,用于分类、回归(例如手写数字识别需标注样本);
监督学习相当于是“老师教”
- 无监督学习:从无标签数据中挖掘结构(如聚类、降维);
无监督学习相当于是在家“自学”
- 强化学习:通过环境反馈优化策略(如游戏AI)。
而强化学习更像是“社会教”,社会不会告诉你什么是对的是错的,只会给你奖励(比如金钱、权力)等,通过这种方法来“学习”
---------------------------------------------------------------------------------------------------------------------------------
三、深度学习:机器学习的“高阶形态”
深度学习(DL)是机器学习的一个子领域,其核心是通过多层次非线性变换**自动提取数据的高层特征。邱老师指出,深度学习的优势在于解决了传统机器学习依赖人工特征工程的局限性,实现了表示学习(Representation Learning)。
例如:
- 图像识别中,神经网络从像素→边缘→局部特征→整体结构逐层抽象;
- 自然语言处理中,词嵌入(Word Embedding)将文本映射到语义空间,实现语义计算。
深度学习的关键问题
1. 贡献度分配问题(CAP)
在复杂系统中(如深度网络),如何确定每个参数对最终输出的贡献?反向传播算法通过链式法则逐层计算梯度,解决了这一难题,这也是神经网络流行的核心原因。
2. 黑箱性与解释性
深度模型的中间过程难以解释,但其强大的特征表达能力使其在图像、语音等领域远超传统方法。
---------------------------------------------------------------------------------------------------------------------------------
四、三者的关系:环环相扣的技术栈
邱老师用一句话概括三者关系:“深度学习是机器学习的分支,而机器学习是实现人工智能的路径”。具体来说:
- 层级包含:AI ⊃ ML ⊃ DL;
- 技术演进:符号主义AI依赖人工规则→机器学习通过数据驱动→深度学习实现端到端自动学习;
- 应用场景:AI覆盖广泛领域(如机器人、NLP),ML侧重算法模型,DL专注复杂特征提取。
---------------------------------------------------------------------------------------------------------------------------------
五、深度学习的挑战与未来
尽管深度学习成效显著,但其仍面临模型鲁棒性差、算力需求高、伦理风险等问题。例如,轻微扰动可能导致模型性能骤降,而大模型训练消耗的能源也引发争议。邱老师书中提到,未来方向可能包括:
1. 更高效的优化算法(如自适应学习率、分布式训练);
2. 模型轻量化与边缘计算(如DeepSeek-R1的开源实践);
3. 多模态与通用人工智能(如OpenAI的Sora模型)。
---------------------------------------------------------------------------------------------------------------------------------
结语
理解人工智能、机器学习与深度学习的关系,是入门AI领域的基石。邱锡鹏老师的书不仅梳理了技术脉络,还引导读者思考“智能的本质”。正如书中所述,深度学习的成功既是数学与工程的结合,也是对人类学习机制的仿生探索。其实还是有点儿恐怖的