
深度学习四大核心架构:神经网络(NN)、卷积神经网络(CNN)、循环神经网络(RNN)与Transformer全概述
NN → 类比:盲人摸象,每个神经元独立感知全局特征 → 局限:输入图像需展平为向量,丢失空间信息(如将28x28图片变成784维向量)CNN → 类比:人类视觉系统,先识别边缘→形状→物体 → 实战:用3x3卷积核扫描猫的图片,提取耳朵、胡须等局部特征RNN → 类比:阅读理解,需记住前文才能理解后文 → 痛点:输入句子“The cat sat on the mat”,到第6个单词时可能已遗忘“cat”Transformer → 类比:团队协作,每个单词直接关注全局上下文 → 优势:处理句
