- 博客(56)
- 收藏
- 关注
原创 基于 U-Net 的医学图像分割
本项目实现了一个端到端的医学图像分割系统,采用U-Net架构处理DSB2018细胞核数据集。核心功能包括:数据预处理(统一尺寸为96×96像素、合并掩码)、数据增强(旋转、亮度对比度调整等)、模型训练(支持深度监督和多种损失函数)以及结果可视化。系统采用模块化设计,支持多种学习率调度和早停机制,能有效防止过拟合。项目完整实现了从数据准备到模型验证的全流程,具有较好的可扩展性,不仅适用于细胞核分割,也可迁移至其他医学图像分析任务。
2025-11-03 16:43:47
989
原创 U-Net系列算法
摘要:U-Net系列模型在图像分割领域持续演进,从基础的U-Net编码器-解码器结构开始,逐步发展为U-Net++和U-Net+++。改进包括特征拼接(U-Net)、DeepSupervision多输出训练(U-Net++)、以及多尺度特征整合(U-Net+++)。这些创新增强了特征融合能力,提升了分割精度,同时保持了模型灵活性,使其广泛应用于医学、遥感和工业检测等领域。U-Net系列通过结构优化不断拓展图像分割的可能性边界。
2025-10-31 14:36:54
288
原创 项目(四)
安装PyTorch时,确保选择了与你的CUDA版本匹配的版本。如果你使用的是自定义模型配置,需要确保权重文件与模型的结构一致。例如,如果你的GPU设备编号为0,可以使用以下命令。确保你的机器支持多GPU训练,并且PyTorch版本支持分布式训练。例如,如果你使用的是预训练权重文件。确保你的机器安装了NVIDIA GPU,并且驱动程序是最新的。确保训练数据没有问题,例如图像文件和标签文件是否匹配。如果权重文件不匹配,可以尝试使用默认的模型配置。例如,如果你有4个GPU,可以使用以下命令。
2025-10-29 15:30:33
340
原创 深入探索图像分割:从基础到应用
图像分割是一种将图像像素分类为不同类别的技术,主要分为语义分割、实例分割和全景分割三个层次。语义分割按类别标记像素,实例分割区分同类实例,全景分割则结合两者。常用数据集包括VOC、Cityscape和COCO,为模型训练提供多样场景。评估指标涵盖像素精度、IoU及其衍生方法。分割网络通常由卷积模块(特征提取)和反卷积模块(上采样)组成,其中转置卷积是实现分辨率恢复的关键技术。
2025-10-29 13:23:10
758
原创 项目(三)
文章摘要: YOLOv5训练参数解析与应用指南详细介绍了模型训练中的关键配置参数,包括模型相关参数(权重、结构、数据集配置)、训练过程参数(迭代轮次、批大小等)、优化策略(矩形训练、多尺度训练)以及设备设置(GPU/CPU选择)。重点参数如--weights指定预训练模型、--data定义数据集配置、--epochs控制训练轮数,而--multi-scale和--rect等参数可提升模型性能。文章还提供了基础训练命令模板和高级配置建议,帮助用户根据任务需求灵活调整参数组合,实现高效模型训练。
2025-10-27 14:58:16
814
原创 项目(一)
YOLOv5数据加载系统支持多种图像/视频格式,具备EXIF自动校正功能。数据加载器支持分布式训练,通过命令行参数配置模型权重、推理尺寸等参数,并优化工作进程数计算。系统提供图像增强、缓存等选项,支持矩形训练和分布式采样器,确保高效稳定的数据加载。
2025-10-24 16:07:53
751
原创 项目(二)
本文解析了YOLO目标检测框架中的关键数据增强技术,重点介绍了Mosaic和MixUp增强方法。Mosaic通过将四张图像拼接成一张大图,实现多尺度训练和上下文学习;MixUp则采用图像线性混合策略增强模型鲁棒性。文章详细阐述了Mosaic的四象限布局算法和坐标转换机制,以及非Mosaic模式下的标准处理流程。这些技术显著提升了数据利用效率,具有多尺度训练、上下文学习、正则化效果和训练稳定性等技术优势,为模型性能提升提供了重要支持。
2025-10-24 15:54:20
579
原创 YOLOv4(二)
YOLOv4通过"BagofFreebies"和"BagofSpecials"技术提升检测性能。前者在不增加推理成本的情况下,采用Mosaic数据增强、SAT训练、DropBlock等方法提高模型泛化能力;后者则通过SPPNet、CSPNet、Mish激活函数等创新结构,以轻微增加计算量为代价显著提升检测精度。这些技术的组合使YOLOv4在速度和精度上取得平衡,成为高效的目标检测框架。
2025-10-21 15:14:48
437
原创 YOLOv4(一)
YOLOv4作为YOLO系列最新版本,在保持快速检测优势的同时显著提升了精度。其核心创新包括:优化单GPU训练降低硬件门槛;采用Mosaic数据增强和SAT技术提高鲁棒性;改进DropBlock和损失函数设计解决过拟合问题;引入DIOU-NMS等新型后处理方法。通过大量消融实验验证,YOLOv4在数据增强、网络正则化和损失函数等多方面进行优化,实现了精度与速度的平衡,为资源有限的研究者提供了高效解决方案。
2025-10-20 14:34:55
421
原创 YOLO-V3深度学习中的目标检测新高度
YOLO-V3在目标检测领域实现重大突破,其核心创新包括:1)采用多尺度特征图融合结构,显著提升小目标检测能力;2)设计3种scale检测机制,通过9种精细先验框适应不同物体尺寸;3)引入残差连接增强网络深度;4)采用全卷积网络架构提高灵活性;5)用logistic替代softmax实现多标签预测。这些改进使YOLO-V3在检测速度和精度上取得平衡,为安防、自动驾驶等应用提供了更优解决方案。
2025-10-17 15:45:46
474
原创 深入解析YOLO
YOLO-V1开创性地将目标检测转化为回归问题,采用7×7网格预测边界框和类别概率,实现实时检测。YOLO-V2在此基础上进行多项改进:引入Batch Normalization、高分辨率分类器提升精度;通过K-means聚类优化先验框;采用多尺度训练增强泛化能力;使用细粒度特征融合解决小目标检测问题。这些改进使YOLO-V2在保持实时性的同时显著提升检测精度,推动了One-Stage目标检测技术的发展。
2025-10-16 14:48:44
593
原创 深度学习在目标检测中的应用与挑战
摘要:目标检测是计算机视觉的关键任务,通过深度学习显著提升了性能。本文探讨了目标检测的基本概念、挑战及评估方法,包括IoU、Precision等指标。介绍了传统方法与深度学习方法(如anchor-base和anchor-free)的差异,以及NMS后处理技术。常用数据集如VOC2007和COCO对模型训练至关重要。尽管面临目标多样性和遮挡等挑战,深度学习方法仍大幅提高了检测效率和准确性,未来有望进一步提升性能。
2025-10-15 13:52:54
412
原创 深度学习:从图片数据到模型训练(十分类)
本文介绍了基于PyTorch实现CIFAR-10图像分类的模型集成方法。首先进行环境准备和数据预处理,包括安装必要库、定义超参数和加载CIFAR-10数据集。然后实现了三个CNN模型(CNNNet、LeNet和VGG),通过20个epoch的训练,使用交叉熵损失函数和Adam优化器进行优化。在测试阶段,采用投票机制对三个模型的预测结果进行集成,显著提升了分类准确率。实验结果表明,模型集成方法有效提升了分类性能,其中VGG16模型的准确率从58.39%提高到89.24%,验证了集成学习在图像分类任务中的有效性
2025-10-15 12:11:02
154
原创 手写数字识别与卷积神经网络
本文探讨了手写数字识别和卷积神经网络(CNN)在图像分类中的应用。首先介绍了使用MNIST数据集构建全连接神经网络的过程,包括数据预处理、模型构建和训练评估。随后重点阐述了CNN在图像处理中的优势,通过实现CNNNet、Net和LeNet等模型结构,展示了卷积层和池化层的特征提取能力。文章详细说明了模型训练、验证和测试的全流程,包括损失监控、准确率计算以及学习率调度等优化技巧。这些方法为图像分类任务提供了有效的解决方案,体现了深度学习在计算机视觉领域的强大能力。
2025-10-13 19:31:03
724
原创 深度学习复现:CIFAR-10 数据集任务的实现(测试集)
全局平均池化是一种特殊的池化操作,它将每个特征图直接降维为一个标量值。具体来说,对于一个尺寸为H×W的特征图,全局平均池化会计算该特征图上所有元素的平均值,最终输出一个1×1的特征值。显著减少参数量:避免全连接层带来的参数爆炸降低过拟合风险:由于参数减少,模型复杂度降低增强平移不变性:对输入图像的位置变化更加鲁棒更好的可解释性:每个特征图对。
2025-09-27 15:27:20
238
原创 深度学习复现:CIFAR-10 数据集任务的实现
本文介绍了使用PyTorch实现CIFAR-10图像分类的过程。首先对CIFAR-10数据集进行标准化预处理,然后构建了一个包含两层卷积和两层全连接的CNN模型。训练采用交叉熵损失和SGD优化器,经10个epoch后模型逐渐收敛。测试阶段评估了模型性能,并提出了数据增强、模型优化、超参数调整等改进方向。实验展示了CNN在图像分类任务中的基本应用流程。
2025-09-26 16:05:24
358
原创 深入探索图像分类:从基础到高级
图像分类包括通用分类、细粒度分类和实例级分类三个层次。评估指标主要有混淆矩阵、精确率、召回率、F1分数和P-R曲线。模型设计需考虑网络深度和宽度。样本不足时可采用迁移学习和数据增强(有监督方法如几何变换、无监督方法如GAN生成)来提升模型性能。
2025-09-25 14:38:28
372
原创 PyTorch数据处理工具箱完全指南:从数据加载到可视化
本文介绍了PyTorch数据处理工具箱的核心组件,包括`Dataset`类和`DataLoader`的高效数据加载与批处理,`torchvision.transforms`的图像预处理方法,以及TensorBoard的可视化工具和特征图可视化技术。通过完整示例展示了这些工具在图像分类中的应用,并提供了参数设置建议,如合理配置`num_workers`和使用`pin_memory`,以提升开发效率和模型性能。
2025-09-24 16:49:40
538
原创 PyTorch神经网络构建指南:从nn.Module到训练循环
PyTorch提供了两种主要方式构建神经网络:nn.Module(面向对象方式,自动管理参数和状态)和nn.functional(函数式接口,更灵活但需手动管理)。构建模型有三种方法:继承nn.Module(最常用)、使用nn.Sequential(快速原型)或混合使用。文章以残差块为例,展示了如何实现ResNet18的核心结构,包括基础残差块和降采样块,最终组合成完整网络。关键点在于理解PyTorch的模块化设计思想,以及残差连接如何通过跳过连接缓解梯度消失问题。
2025-09-23 15:25:42
424
原创 深入探索卷积神经网络:从基础到高级架构(二)
摘要:VGG19网络包含16个卷积层和3个全连接层,通过3×3小卷积核堆叠实现深层网络。PyTorch中nn.Module类可自动管理参数,适用于可学习层;nn.functional为纯函数,需手动传参,适用于无状态操作。主要区别在于nn.Module支持参数管理、Sequential集成和训练/测试状态切换,而nn.functional更灵活但复用性差。
2025-09-22 14:53:43
314
原创 深入探索卷积神经网络:从基础到高级架构(一)
本文探讨了卷积神经网络(CNN)在图像处理中的优势。相比全连接层,CNN通过卷积层和池化层有效降低了参数量,保留了图像空间结构信息,具有平移不变性和局部性特点。文章详细介绍了卷积核、填充、步幅等核心概念,以及池化层的作用。最后分析了LeNet和AlexNet两种经典CNN架构,前者奠定了基础,后者通过ReLU激活函数、Dropout和数据增强等创新推动了深度学习在计算机视觉的应用。
2025-09-19 14:41:00
587
原创 深入解析多层感知机:从感知机到深度学习
本文介绍了多层感知机(MLP)的发展历程及其工作原理。首先阐述了感知机的概念、功能及其局限性,指出它只能处理线性可分数据。接着重点介绍了MLP如何通过引入隐藏层和非线性激活函数突破这一限制,并详细说明了隐藏层作用和常用激活函数特性。文章还完整描述了MLP的训练过程,包括前向传播和反向传播机制,以及关键超参数的选择方法。最后讨论了过拟合与欠拟合问题及其解决方案。MLP作为深度学习的基础模型,通过合理设计可有效处理复杂分类任务。
2025-09-18 15:13:14
1026
原创 深入解析线性回归与Softmax回归:深度学习中的基础模型
本文介绍了深度学习中两个基础模型——线性回归和Softmax回归。线性回归通过最小化预测值与真实值的差异(如平方损失函数)来解决回归问题,使用梯度下降等方法优化参数。Softmax回归则将线性输出转换为概率分布(通过Softmax函数),采用交叉熵损失进行多类分类。这两个模型分别适用于连续值预测(如房价)和离散分类任务(如图像识别),是机器学习的重要基础工具。
2025-09-17 15:36:05
488
原创 深度学习:从预备知识到未来展望
摘要:深度学习作为人工智能的核心技术,正深刻改变社会各领域。本文系统梳理了深度学习的知识体系,包括其工业文明背景、人工智能定义、机器学习基础(监督/无监督/强化学习)以及PyTorch框架特点。文章分析了数据爆炸和算力提升对深度学习的推动作用,列举了其在计算机视觉、自然语言处理等领域的成功应用案例,并展望了未来在伦理规范、跨学科融合和技术创新等方面的发展方向,指出深度学习将持续引领智能化变革。
2025-09-16 17:00:00
902
原创 把 SVM 拆开揉碎:一篇人人都能看懂的超全指南
SVM是一种通过寻找最优超平面来分类数据的机器学习方法。其核心思想是最大化分类边界与最近数据点(支持向量)的距离,提高模型的泛化能力。数学上转化为求解带约束的二次优化问题,可通过软间隔和核函数处理噪声和线性不可分数据。常用的RBF核能有效映射高维空间,而参数C和γ需调优。实践表明,标准化数据后使用SVM(如scikit-learn实现)能达到98%的准确率。手写简化版SMO算法也验证了其核心逻辑——通过支持向量确定分类边界,其余数据点不影响最终决策面。
2025-08-26 17:51:36
444
原创 朴素贝叶斯算法:从贝叶斯定理到文本分类实战
本文介绍了贝叶斯定理及其应用。贝叶斯定理由英国数学家托马斯·贝叶斯提出,用于解决逆向概率问题,现已成为机器学习的重要工具。文章通过校园案例和拼写纠正、垃圾邮件分类等实例,展示了贝叶斯公式的实际应用。还介绍了Scikit-learn中的三种朴素贝叶斯实现方法,并以手写数字识别为例进行实战演示。尽管朴素贝叶斯假设特征独立的条件在现实中往往不成立,但其简单高效、参数少、对缺失数据不敏感等特点,使其在文本分类、垃圾邮件过滤等领域仍具有广泛应用价值。
2025-08-25 16:38:53
602
原创 线性回归:机器学习中的基石
摘要:本文介绍了线性回归模型的基本概念、求解方法和评估指标,包括最小二乘法和MSE、R²等。通过一个包含气温、湿度等特征的模拟气象数据集,展示了如何使用Python进行数据探索和可视化。模型评估显示MSE为4.01,R²为0.82,表明拟合效果良好。参数分析表明气温是预测第二天气温的主要因素,而湿度、风速和气压的影响较小。本文完整地展示了线性回归的应用流程。
2025-08-22 16:14:18
1979
1
原创 机器学习中的聚类与集成算法:从基础到应用
聚类是一种无监督学习方法,其核心思想是将数据集中的对象分组,使得同一组内的对象相似度高,而不同组之间的对象相似度低。在没有标签的情况下,聚类算法通过发现数据中的内在结构,帮助我们理解数据的分布和特征。在实际应用中,聚类算法面临着诸多挑战,例如如何评估聚类结果的质量、如何选择合适的参数等。这些难点使得聚类算法的使用需要更多的经验和技巧。集成学习是一种强大的机器学习方法,它通过构建并结合多个学习器来完成学习任务。
2025-08-21 17:36:37
869
原创 数据预处理:机器学习中的关键步骤
数据预处理是机器学习中不可或缺的一步。通过处理缺失值、数据标准化、特征编码和数据二值化等操作,可以显著提高数据的质量,从而提升模型的性能。希望这篇文章能帮助你更好地理解和应用数据预处理技术。
2025-08-20 14:21:43
976
原创 决策树算法全景解析:从 ID3、C4.5 到 CART
C4.5/CART 会枚举候选切分点(通常取相邻两样本均值),选信息增益/基尼最大的那个。可解释性强——“如果年龄 > 30 且收入 < 10k,则拒绝贷款”一句话就能说清;问“CART 与 C4.5 区别”——答“二叉切分 + 基尼指数 + 支持回归”。问“C4.5 怎么改进”——答“除以自身熵得到信息增益率,加惩罚项”;面试问“信息增益缺点”——答“偏向多取值属性,易过拟合”;将缺失样本按概率分到子节点(C4.5 的“权重法”)。天然支持混合类型特征——数值、类别、缺失值都能吃;
2025-08-19 17:21:34
330
原创 决策树:机器学习中的强大工具
决策树是一种树模型,从根节点开始,通过一系列的决策逐步到达叶子节点,最终实现分类或回归任务。它的结构非常直观,类似于我们日常生活中的决策过程。根节点:第一个选择点,通常是最重要的特征。非叶子节点与分支:中间过程,用于进一步细分数据。叶子节点:最终的决策结果,表示分类或回归的输出。例如,假设我们有一个关于天气的数据集,包含温度、湿度、风力等特征,目标是预测是否会去打球。决策树会从根节点开始,根据某个特征(如温度)进行第一次决策,然后根据结果继续细分,最终到达叶子节点,给出是否打球的预测。
2025-08-18 14:31:08
876
原创 探索K最近邻算法(KNN)
花萼长度花萼宽度花瓣长度花瓣宽度通过本文的介绍,我们不仅了解了KNN算法的基本原理和实现步骤,还通过鸢尾花分类的实际案例,展示了如何使用Python和scikit-learn库来实现这一算法。希望读者能够通过这些内容,更好地理解和掌握KNN算法在机器学习中的应用。
2025-08-15 11:42:52
348
原创 数据科学与计算:从基础到实践的全面探索
本文介绍了数据科学的核心工具与技术,包括NumPy的数组操作、Pandas的数据处理、Matplotlib和Seaborn的可视化功能。通过电商双11美妆数据分析案例,展示了如何运用这些工具进行数据清洗、筛选和可视化分析,帮助理解数据模式并支持商业决策。掌握这些工具对学术研究和商业应用都具有重要价值。
2025-08-13 17:00:00
811
原创 电商双11美妆数据分析
本文基于Heywhale电商数据,分析了双11美妆产品的销售趋势与消费者行为。通过品类、品牌、价格区间的可视化分析,揭示了美妆市场分布特征;结合购买时间、地域分布等维度,深入解读了消费者偏好。研究发现,促销活动和新品推广对销量影响显著,不同价格段产品表现差异明显。这些数据洞察为品牌营销策略优化提供了重要参考依据。
2025-08-12 16:36:07
386
原创 爬虫与数据分析的奇妙碰撞:从中国大学排名到豆瓣电影评分
摘要:本文展示了爬虫与数据分析技术在中国大学排名和豆瓣电影评分中的应用实践。通过爬取大学排名数据,采用删除空值、均值填充等方法进行数据清洗,并运用柱形图、饼图等可视化手段分析学校星级分布特征。同时,豆瓣电影评分数据通过多种图表呈现评分分布趋势。案例证明,数据爬取与分析技术能有效挖掘海量数据价值,为决策提供直观依据,展现了该技术在教育评估、影视评价等领域的广泛应用前景。
2025-08-11 15:50:36
321
原创 数据可视化利器:Seaborn
Seaborn是基于Matplotlib的Python数据可视化库,专注于统计图形绘制。它提供简洁的高级接口和美观的默认主题,支持散点图、折线图、柱形图、箱线图、热图和小提琴图等多种图表类型。通过sns.set_theme()可灵活设置主题样式,适用于不同场景。安装简单,使用少量代码即可生成专业可视化效果,是数据分析中探索数据特征和关系的强大工具。
2025-08-08 17:00:00
573
原创 数据科学的得力助手:Pandas 进阶
Pandas是一个功能强大的库,它提供了丰富的工具来处理和分析数据。从高级索引到时间序列分析,Pandas的功能使其成为数据科学家和分析师的重要工具。掌握这些高级功能,你将能够更有效地从数据中提取洞察,并做出更明智的决策。
2025-08-07 16:20:10
416
原创 探索数据可视化的魔力
本文介绍了Python中使用Matplotlib库进行数据可视化的基础知识。Matplotlib作为功能强大的绘图工具,支持线图、柱状图、饼图等多种图表类型。文章通过示例代码演示了基本绘图、多图表绘制以及自定义图表样式的方法,包括改变颜色、线条样式和添加标记等。同时展示了如何创建柱状图和饼图来呈现分类数据和占比情况。Matplotlib的可定制性使其成为数据分析中不可或缺的工具,有效帮助用户理解和展示数据背后的信息。
2025-08-07 16:12:57
292
原创 Pandas常用数据处理方法详解
在数据分析和数据科学领域,Pandas 是一个不可或缺的工具。它提供了强大的数据结构和数据分析工具,使得数据处理变得简单而高效。本文将详细介绍 Pandas 中一些常用的数据处理方法,并通过一个具体的案例来展示这些方法的应用。
2025-08-06 16:59:10
886
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅