计算机视觉与深度学习:从基础到应用
1. 人工智能与机器学习概述
人工智能(AI)旨在将人类思维融入计算机,打造模拟生物大脑功能的人造大脑。早期的第一代 AI 专注于人类能够形式化描述的问题,机器依照人类编写的指令机械执行,缺乏自主思考能力,如同主从关系,人类是主导,机器只是执行者。
然而,人类只能对简单问题进行完整描述,如井字棋和国际象棋。对于复杂任务,如语音转文本、图像识别和情感分析等,难以用静态代码解决。因为这些任务没有单一的分类规则,即使为特定环境创建了规则,在其他环境中也往往失效。
为了使机器具备处理这些复杂任务的能力,机器学习(ML)应运而生。在 ML 中,规则由机器学习得出。人类负责收集和标注数据、提取合适的特征并选择最佳的 ML 算法,之后 ML 算法学习人类提供的信息,寻找输入与输出之间的映射规则。
但传统 ML 算法存在局限性,在特定环境中训练的数据往往无法在其他环境中有效工作。随着数据量的不断增加,传统 ML 技术在处理复杂数据时显得力不从心。例如,图像由于其内部的多样性,使用一组工程特征进行描述非常困难,为了使 ML 算法适用于不同环境,往往需要重复进行特征工程工作。
2. 深度学习的崛起
当人类在处理大量类别时,寻找有效区分特征的能力会下降。此时,我们可以让机器自主探索数据,寻找合适的特征进行分类,这就是深度学习(DL)。深度学习专注于从原始数据中直接得出结论,无需进行特征工程这一中间步骤,因此可以被称为“自动化特征工程”。虽然深度学习在处理和内存需求方面较为苛刻,可能需要数周时间才能区分不同类别,但它是处理大量图像数据的趋势,卷积神经网络(CNN)就是处理大量图像的主流 DL 模型。 </
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



