- 博客(8)
- 收藏
- 关注
原创 《卷积神经网络(CNN)核心知识点全解析》
卷积神经网络(CNN)是处理图像等空间结构化数据的深度学习模型,主要由卷积层(特征提取)、池化层(下采样)和全连接层(特征整合)构成,通过ReLU等激活函数引入非线性。经典架构包括LeNet-5、AlexNet、VGGNet、GoogLeNet和ResNet,其中ResNet的残差连接解决了深度网络的梯度问题。CNN通过交叉熵损失函数和Adam等优化算法进行训练,并采用数据增强防止过拟合。广泛应用于图像分类、目标检测和医疗影像分析,具有平移不变性优势,但对旋转缩放变换较敏感,解释性也较弱。
2025-11-18 16:35:02
872
原创 《卷积神经网络知识点总结与思考》
卷积神经网络(CNN)是处理图像、视频等网格数据的深度学习架构,通过局部感知和参数共享机制高效提取空间特征。其核心结构包括:卷积层(提取局部特征)、激活层(引入非线性)、池化层(降维)、全连接层(分类)和输出层。经典CNN模型不断演进,在图像分类、目标检测、图像分割等计算机视觉任务中广泛应用。CNN的优势在于能自动学习层次化特征,从底层边缘纹理到高层语义信息,大幅提升图像处理性能。
2025-10-24 14:45:15
786
原创 《深度学习相关知识点总结与思考》
深度学习是基于深度神经网络的机器学习方法,通过多层非线性变换自动学习数据特征,实现端到端学习。核心包括神经元、激活函数等基础组件,以及CNN、RNN、Transformer等经典网络架构。关键技术涵盖数据预处理、过拟合抑制、批处理等。实践流程遵循数据准备→模型构建→训练→评估→部署的闭环,应用领域广泛覆盖计算机视觉、自然语言处理、语音识别等。深度学习摆脱了传统机器学习依赖人工特征工程的局限,成为解决复杂非线性问题的重要工具。
2025-10-23 11:31:44
542
原创 《“加载预训练词向量”模块的代码和关键步骤整理与总结》
词向量是自然语言处理中表示单词的低维稠密向量,解决了独热编码的高维稀疏问题。其核心思想是基于分布式假设,通过上下文相似性学习单词语义关系。主流方法包括Word2Vec、GloVe和FastText。词向量能捕捉语义语法关系、作为模型输入特征、缓解数据稀疏性,并支持跨任务迁移。实际应用中需加载预训练词向量文件,构建词汇表并提取对应向量,为NLP任务提供基础语义表示。关键步骤包括文件解析、特殊符号处理和向量矩阵转换。
2025-10-17 16:47:52
880
原创 《AlexNet:深度学习图像识别的里程碑 》
AlexNet是2012年提出的8层卷积神经网络,在ImageNet竞赛中以15.3%的错误率夺冠,开创了深度学习在计算机视觉领域的先河。其创新点包括:首次使用ReLU激活函数解决梯度消失问题,采用Dropout和数据增强防止过拟合,并引入局部响应归一化(LRN)。网络采用5个卷积层和3个全连接层,通过双GPU并行训练。虽然存在参数量大、结构冗余等不足,但AlexNet奠定了CNN设计范式,推动了后续VGG、ResNet等模型发展,使端到端学习成为计算机视觉的主流方法。
2025-10-16 09:34:32
1108
原创 《LSTM更新计算过程详解》
LSTM(长短期记忆网络)通过"记忆处理工厂"的机制有效处理长序列信息。其核心包含三个控制门:遗忘门决定保留多少旧记忆,输入门控制新记忆的准入,输出门筛选当前要传递的关键信息。通过六个关键公式,LSTM实现了"筛选旧记忆-生成候选记忆-更新核心记忆-输出关键信息"的完整流程。其中细胞状态(ct)作为长期记忆载体,通过门控机制实现信息的动态更新与传递,解决了传统RNN的梯度消失问题。这种结构使LSTM能够选择性记住重要信息,遗忘无关内容,在处理长文本、时间序列等任务时表现出色。
2025-10-15 11:12:56
1021
原创 《代码中Mindspore关键API接口的调用和使用说明》
参数解释:nn.RMSProp(params, learning_rate),params是网络中需要更新的可训练参数,通常通过network.trainable_params()获取;使用例子:ds_xtrain= Tensor(X_train, ms.float32),ds_ytrain= Tensor(Y_train, ms.int32),ds_xtest=Tensor(X_test, ms.float32),ds_ytest=Tensor(Y_test, ms.int32)。
2025-09-28 11:58:23
739
原创 《集成算法入门:从 Bagging 到 Boosting,用 sklearn 实现并对比效果》
决策树本文为集成算法入门内容,先指出单模型易过拟合、欠拟合的问题,引出集成算法 “组合弱模型成强模型” 的思路,简介 Bagging、Boosting、Stacking 三类算法并通俗区分前两者。重点以随机森林为例,解析其 “样本 + 特征随机” 原理与 “投票 / 平均” 决策方式,提供基于 sklearn 的完整代码,用鸢尾花数据集实现分类,含数据处理、模型训练与评估,还配套可视化。最后总结随机森林优劣势、应用场景及参数调优建议,兼具理论与实操性。
2025-09-25 10:56:43
726
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅