zhangyanning1-优快云博客

原创《卷积神经网络（CNN）核心知识点全解析》

卷积神经网络（CNN）是处理图像等空间结构化数据的深度学习模型，主要由卷积层（特征提取）、池化层（下采样）和全连接层（特征整合）构成，通过ReLU等激活函数引入非线性。经典架构包括LeNet-5、AlexNet、VGGNet、GoogLeNet和ResNet，其中ResNet的残差连接解决了深度网络的梯度问题。CNN通过交叉熵损失函数和Adam等优化算法进行训练，并采用数据增强防止过拟合。广泛应用于图像分类、目标检测和医疗影像分析，具有平移不变性优势，但对旋转缩放变换较敏感，解释性也较弱。

2025-11-18 16:35:02 872

原创《卷积神经网络知识点总结与思考》

卷积神经网络（CNN）是处理图像、视频等网格数据的深度学习架构，通过局部感知和参数共享机制高效提取空间特征。其核心结构包括：卷积层（提取局部特征）、激活层（引入非线性）、池化层（降维）、全连接层（分类）和输出层。经典CNN模型不断演进，在图像分类、目标检测、图像分割等计算机视觉任务中广泛应用。CNN的优势在于能自动学习层次化特征，从底层边缘纹理到高层语义信息，大幅提升图像处理性能。

2025-10-24 14:45:15 786

原创《深度学习相关知识点总结与思考》

深度学习是基于深度神经网络的机器学习方法，通过多层非线性变换自动学习数据特征，实现端到端学习。核心包括神经元、激活函数等基础组件，以及CNN、RNN、Transformer等经典网络架构。关键技术涵盖数据预处理、过拟合抑制、批处理等。实践流程遵循数据准备→模型构建→训练→评估→部署的闭环，应用领域广泛覆盖计算机视觉、自然语言处理、语音识别等。深度学习摆脱了传统机器学习依赖人工特征工程的局限，成为解决复杂非线性问题的重要工具。

2025-10-23 11:31:44 542

原创《“加载预训练词向量”模块的代码和关键步骤整理与总结》

词向量是自然语言处理中表示单词的低维稠密向量，解决了独热编码的高维稀疏问题。其核心思想是基于分布式假设，通过上下文相似性学习单词语义关系。主流方法包括Word2Vec、GloVe和FastText。词向量能捕捉语义语法关系、作为模型输入特征、缓解数据稀疏性，并支持跨任务迁移。实际应用中需加载预训练词向量文件，构建词汇表并提取对应向量，为NLP任务提供基础语义表示。关键步骤包括文件解析、特殊符号处理和向量矩阵转换。

2025-10-17 16:47:52 880

原创《AlexNet：深度学习图像识别的里程碑》

AlexNet是2012年提出的8层卷积神经网络，在ImageNet竞赛中以15.3%的错误率夺冠，开创了深度学习在计算机视觉领域的先河。其创新点包括：首次使用ReLU激活函数解决梯度消失问题，采用Dropout和数据增强防止过拟合，并引入局部响应归一化（LRN）。网络采用5个卷积层和3个全连接层，通过双GPU并行训练。虽然存在参数量大、结构冗余等不足，但AlexNet奠定了CNN设计范式，推动了后续VGG、ResNet等模型发展，使端到端学习成为计算机视觉的主流方法。

2025-10-16 09:34:32 1108

原创《LSTM更新计算过程详解》

LSTM（长短期记忆网络）通过"记忆处理工厂"的机制有效处理长序列信息。其核心包含三个控制门：遗忘门决定保留多少旧记忆，输入门控制新记忆的准入，输出门筛选当前要传递的关键信息。通过六个关键公式，LSTM实现了"筛选旧记忆-生成候选记忆-更新核心记忆-输出关键信息"的完整流程。其中细胞状态（ct）作为长期记忆载体，通过门控机制实现信息的动态更新与传递，解决了传统RNN的梯度消失问题。这种结构使LSTM能够选择性记住重要信息，遗忘无关内容，在处理长文本、时间序列等任务时表现出色。

2025-10-15 11:12:56 1021

原创《代码中Mindspore关键API接口的调用和使用说明》

参数解释：nn.RMSProp(params, learning_rate)，params是网络中需要更新的可训练参数，通常通过network.trainable_params()获取；使用例子：ds_xtrain= Tensor(X_train, ms.float32)，ds_ytrain= Tensor(Y_train, ms.int32)，ds_xtest=Tensor(X_test, ms.float32)，ds_ytest=Tensor(Y_test, ms.int32)。

2025-09-28 11:58:23 739

原创《集成算法入门：从 Bagging 到 Boosting，用 sklearn 实现并对比效果》

决策树本文为集成算法入门内容，先指出单模型易过拟合、欠拟合的问题，引出集成算法 “组合弱模型成强模型” 的思路，简介 Bagging、Boosting、Stacking 三类算法并通俗区分前两者。重点以随机森林为例，解析其 “样本 + 特征随机” 原理与 “投票 / 平均” 决策方式，提供基于 sklearn 的完整代码，用鸢尾花数据集实现分类，含数据处理、模型训练与评估，还配套可视化。最后总结随机森林优劣势、应用场景及参数调优建议，兼具理论与实操性。

2025-09-25 10:56:43 726 1

zhangyanning1的博客