禾昂.-优快云博客

原创从U-Net到U-Net++：图像分割网络的进阶之路

U-Net和U-Net++是图像分割领域的两种经典网络架构。U-Net采用编码器-解码器结构，通过跳跃连接融合多尺度特征，在医学图像分割等小目标检测任务中表现优异。U-Net++在U-Net基础上引入了嵌套U型结构和更精细的特征融合机制，通过多尺度损失函数和模块剪枝优化了梯度回传效率。二者在医学影像分析、卫星图像处理和工业缺陷检测等领域有广泛应用，未来有望与Transformer等新技术融合进一步提升性能。U-Net++虽然复杂度更高，但特征融合更精细，为图像分割任务提供了更优解决方案。

2025-10-31 16:00:01 292

原创深度学习图像分割：从概念到网络架构全解析

图像分割是计算机视觉中实现像素级分类的关键技术，比目标检测更精细。主要分为语义、实例和全景三种类型，应用于人像抠图、医学影像等领域。常用数据集包括VOC、Cityscapes和COCO，评估指标主要有PA、mIoU等。核心技术采用编码器-解码器架构，通过反卷积恢复图像尺寸。随着Transformer等新技术的引入，图像分割将向更高精度、更快速度和更强泛化能力发展，为医疗、自动驾驶等应用提供强大支持。掌握基础知识对深入研究该技术至关重要。

2025-10-29 15:32:15 922

原创 YOLOv5 深度解析：从模型可视化到核心技术与编程实践

YOLOv5作为高效的计算机视觉目标检测模型，其核心创新包括Focus模块、CSP结构、SPP机制和Bottleneck模块。通过Netron工具可直观展示模型架构，支持.pt和ONNX格式转换。网络结构由YAML灵活定义，采用PAN流程实现多尺度特征融合。实践环节涵盖模型构建、训练流程优化及调试技巧，强调模块化编程和配置文件管理。YOLOv5在保持检测精度的同时优化了速度，为开发者提供了完善的工具链和清晰的实现路径。

2025-10-27 16:23:48 920

原创 YOLOv4 技术要点深度解读：兼顾速度与精度的目标检测革新

YOLOv4通过"Bag of Freebies"和"Bag of Specials"两大技术体系，在保持高效推理速度的同时显著提升检测精度。其创新包括：Mosaic数据增强、DropBlock正则化、CIoU损失函数优化、DIoU-NMS改进，以及SPP、CSP、PAN等网络结构创新。这些技术使YOLOv4在单GPU训练条件下实现实时高精度检测，有效应对遮挡、模糊等复杂场景。YOLOv4的成功体现了实用主义设计理念，为工业检测、自动驾驶等应用提供了高效解决方案。

2025-10-21 16:02:15 657

原创深入解析 YOLOv4：兼顾速度与精度的目标检测王者

YOLOv4在目标检测领域实现了速度与精度的完美平衡。通过数据增强（Mosaic、随机区域处理）、网络改进（DropBlock、标签平滑）和损失函数创新（GIOU/DIOU/CIOU），不仅提升了模型鲁棒性，还优化了检测性能。其特色包括：单GPU可训练、实时推理能力、抗遮挡设计等，使YOLOv4成为兼顾效率和准确性的经典模型，为科研和工业应用提供了可靠解决方案。

2025-10-20 15:38:18 901

原创从 YOLO V1 到 V2：目标检测领域的一次关键技术迭代

YOLO系列从V1到V2的演进体现了目标检测技术如何平衡速度与精度。YOLOV1首创"单次检测"理念，通过7x7网格划分和端到端回归实现实时检测，但存在小目标检测差、重叠目标漏检等问题。YOLOV2针对性地引入批量归一化、Darknet轻量网络、K-means聚类生成先验框等技术，并采用多尺度特征融合和动态训练策略，在保持速度优势的同时显著提升检测精度。这种问题导向的迭代思路为后续YOLO系列发展奠定了基础，展示了工程化优化的价值。

2025-10-16 14:07:05 659

原创一文读懂目标检测：从评估指标到核心算法全解析

本文系统介绍了目标检测技术的核心内容。在评估指标方面，重点分析了IoU、Precision、Recall指标的计算方法，以及综合评估模型性能的AP与mAP指标。在算法发展方面，梳理了从传统滑动窗口方法到深度学习Anchor-based和Anchor-free方法的演进历程，详细比较了两阶段和单阶段检测模型的优缺点，并介绍了非极大值抑制等关键后处理技术。文章指出，目标检测技术正朝着更精准、更快速、更简洁的方向发展，通过融合新型网络架构，持续优化对小目标、遮挡目标的检测能力，以更好地满足自动驾驶、智能监控等实际

2025-10-15 14:16:12 532

原创深度学习实战：基于 PyTorch 的 MNIST 手写数字识别

本文介绍了使用PyTorch框架实现MNIST手写数字识别的完整流程。首先进行数据准备，包括导入必要的库、定义超参数、数据预处理和可视化。然后构建了一个包含两个隐藏层的神经网络模型，使用ReLU激活函数和批量归一化。在模型训练阶段，采用交叉熵损失函数和带动量的SGD优化器，并实现动态学习率调整策略。最后通过可视化训练损失曲线展示模型收敛过程。该实验完整展示了深度学习项目从数据准备到模型评估的全流程，为初学者提供了深度学习入门的实践范例。

2025-10-13 14:21:32 441

原创神经网络轻量化与集成学习技术探索

文章摘要：本文探讨了神经网络轻量化设计、模型评估统一性和集成学习技术。通过全局平均池化等方法实现模型轻量化，降低参数量；强调训练/测试集采用相同预处理以保证评估准确性；介绍集成学习中投票法和加权平均法的应用。文章结合代码实践，展示了如何构建高效神经网络模型，平衡性能与资源需求，为AI模型优化提供实用方案。（149字）

2025-09-28 11:20:47 453

原创深度学习模型优化：从全流程复盘到全局平均池化应用

本文分享了深度学习项目实践中的关键流程和优化技术。首先回顾了项目全流程：包括数据预处理（转换为Tensor并归一化）、18层CNN网络结构、模型测试与评估方法（准确率计算代码示例），指出当前模型66%的准确率仍有优化空间。重点介绍了全局平均池化技术，它能替代全连接层实现参数压缩和特征整合，通过代码展示了如何在网络深层使用AdaptiveAvgPool2d(1)结合全连接层。文章还澄清了卷积核的多通道处理机制，强调针对不同数据类型（如序列/图像）应选择适当网络结构。

2025-09-27 14:17:32 779

原创 PyTorch 实现 CIFAR-10 图像分类（类似猫狗识别的图像分类实践）

本文介绍了使用PyTorch实现CIFAR-10数据集图像分类的全过程。首先对数据集进行加载和预处理，包括归一化、标准化等操作；然后构建包含卷积层、池化层和全连接层的CNN网络模型；接着定义交叉熵损失函数和SGD优化器进行模型训练；最后在测试集上评估模型性能。整个流程涵盖数据加载、模型构建、训练与测试等关键环节，为计算机视觉分类任务提供了完整实现方案。该方法也可应用于类似任务如猫狗识别，只需调整输出层等参数。

2025-09-26 14:20:01 629

原创深度学习图像分类：从基础逻辑到核心评估体系解析

本文系统介绍了图像分类技术的核心逻辑与应用场景。首先解析了图像分类的基本概念和Softmax输出层的置信度评分机制；然后将分类任务划分为三个层次：通用多类别分类、细粒度子类分类和个体识别，分别对应不同技术难度；最后详细阐述了混淆矩阵、准确率、精确率和召回率等关键评估指标，并分析了精确率与召回率的权衡关系。文章指出，理解图像分类技术体系有助于根据实际需求优化模型设计，为智能化应用提供核心支撑。

2025-09-25 14:51:50 496

原创读懂 PyTorch 数据处理：从组件到可视化

本文介绍了PyTorch数据处理与可视化的核心工具：1）Dataset定义数据读取规则，DataLoader实现批量加载；2）transforms构建数据预处理流水线；3）torchvision提供预训练模型和标准数据集；4）TensorBoard可视化训练过程。通过4步流程（定义-处理-加载-监控）快速搭建深度学习数据管道，提升训练效率。

2025-09-24 14:22:32 381

原创 PyTorch 神经网络实战：核心知识与模型构建

本文系统介绍了PyTorch神经网络的核心知识，包括四大基础组件（层、模型、损失函数、优化器）和核心流程（正向传播、反向传播）。重点讲解了三种模型构建方法：子类化nn.Module、nn.Sequential顺序堆叠和模型容器（ModuleList/ModuleDict）。通过MNIST手写数字识别案例，对比了全连接网络与CNN的差异，并详细说明了6步模型训练流程（数据加载、损失定义、训练循环等）。文章还介绍了残差块和ResNet18实现原理，帮助读者掌握深度学习模型构建和训练的关键技术。

2025-09-23 14:11:18 659

原创深度学习入门：读懂卷积神经网络与 PyTorch 核心知识

本文系统介绍了卷积神经网络(CNN)的核心原理与应用。首先阐述了CNN相比多层感知机的优势：保留图像空间结构、参数共享和平移不变性。详细解析了CNN的核心组件：卷积层提取特征、池化层降维、激活函数引入非线性。梳理了从LeNet到ResNet的经典网络演进历程，以及目标检测网络的发展。同时讲解了PyTorch框架的四大核心组件：层、模型、损失函数和优化器，对比了nn.Module和nn.functional的差异，并概述了模型训练的核心流程和过拟合解决方法。全文重点突出CNN的基础原理和关键概念，为深度学习入

2025-09-22 15:51:29 861

原创从多层感知机到卷积神经网络：图像处理模型的进化之路

卷积神经网络（CNN）通过参数共享、平移不变性和局部性等特性，有效解决了多层感知机（DNN）在图像处理中的空间结构丢失和参数量过大问题。CNN采用分层特征提取机制，从底层边缘到高层语义逐步抽象图像特征，并运用填充、步幅和池化等关键技术优化特征提取。经典架构如LeNet-5、AlexNet和VGG网络展示了CNN的演进历程，其中AlexNet引入ReLU和Dropout等创新推动了深度学习发展。实际应用中需根据数据集复杂度匹配模型规模，避免欠拟合或过拟合，以实现最佳性能。

2025-09-19 14:07:25 975 1

原创从感知机到多层感知机：解锁神经网络的非线性世界

本文系统梳理了神经网络从感知机到多层感知机(MLP)的核心发展历程。首先介绍了感知机的基本原理，包括其结构设计、逻辑电路模拟能力及线性不可分的局限性。重点分析了MLP通过引入隐藏层和非线性激活函数突破感知机瓶颈的机制，并以异或门问题为例阐释其工作原理。文章还详细讲解了神经网络训练中的正向传播、反向传播算法，以及过拟合与欠拟合问题的应对策略。最后给出了实际训练前的"测试跑"小技巧，强调模型复杂度与数据复杂度匹配的重要性，为深度学习入门者提供了清晰的理论框架和实践指导。

2025-09-18 16:14:16 1112

原创从房价预测到图片分类：小白也能看懂的线性回归与 Softmax 回归

本文介绍了深度学习中两个基础模型：线性回归和Softmax回归。线性回归通过建立特征与目标值的线性关系（y=wᵀx+b）预测连续值（如房价），使用平方损失等评估预测误差，并采用梯度下降优化算法调整参数。Softmax回归则用于多分类任务，将线性回归输出通过Softmax函数转化为概率分布，采用交叉熵损失优化模型，其本质是一个单层神经网络。文章通过房价预测和图片分类等实例，通俗讲解了两个模型的核心思想、数学表达和优化方法，特别强调了小批量随机梯度下降中学习率选择的重要性，为深度学习初学者提供了清晰的学习路径。

2025-09-17 15:16:32 699

yuhang778的博客

原创从U-Net到U-Net++：图像分割网络的进阶之路

原创深度学习图像分割：从概念到网络架构全解析

原创 YOLOv5 深度解析：从模型可视化到核心技术与编程实践

原创 YOLOv4 技术要点深度解读：兼顾速度与精度的目标检测革新

原创深入解析 YOLOv4：兼顾速度与精度的目标检测王者

原创从 YOLO V1 到 V2：目标检测领域的一次关键技术迭代

原创一文读懂目标检测：从评估指标到核心算法全解析

原创深度学习实战：基于 PyTorch 的 MNIST 手写数字识别

原创神经网络轻量化与集成学习技术探索

原创深度学习模型优化：从全流程复盘到全局平均池化应用

原创 PyTorch 实现 CIFAR-10 图像分类（类似猫狗识别的图像分类实践）

原创深度学习图像分类：从基础逻辑到核心评估体系解析

原创读懂 PyTorch 数据处理：从组件到可视化

原创 PyTorch 神经网络实战：核心知识与模型构建

原创深度学习入门：读懂卷积神经网络与 PyTorch 核心知识

原创从多层感知机到卷积神经网络：图像处理模型的进化之路

原创从感知机到多层感知机：解锁神经网络的非线性世界

原创从房价预测到图片分类：小白也能看懂的线性回归与 Softmax 回归

原创从日常到技术：小白入门深度学习的超详细指南

原创新手学 SVM：从 “看不懂公式” 到 “摸清套路” 的笔记分享

原创从零看懂朴素贝叶斯：不用代码，小白也能吃透的分类算法

原创从零开始学线性回归：小白也能懂的机器学习入门

原创刚学完数据处理基础！小白也能看懂的入门笔记

原创新手小白的数据分析入门：数据处理那些事儿

原创从零基础入门决策树：算法、实战与避坑指南

原创小白入门决策树：像 “选领导” 一样做决策的神奇算法

空空如也

空空如也