图像分割
文章平均质量分 81
图像分割技术相关研究与探索
reset2021
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Mask R-CNN
不仅能够完成目标检测(检测物体并给出边界框),还能为每个检测到的物体生成精确的像素级分割掩码(Mask)。:二值交叉熵(Binary Cross-Entropy),计算每个像素的预测掩码与真实掩码的误差。的掩码(K 是类别数,m 是掩码分辨率,通常 14×14 或 28×28)。Mask 分支仅预测当前类别对应的掩码,避免不同类别竞争,提升分割质量。:预测每个 RoI 的分割掩码(Mask),采用 FCN 结构。在原有的分类(Class)和回归(Box)分支基础上,新增一个。原创 2025-04-22 09:37:24 · 925 阅读 · 0 评论 -
图像分割的发展历程
如Non-local Networks(2018)、CBAM(2018),增强重要区域权重。扩展Faster R-CNN,增加分割分支,实现检测与分割一体化(实例分割)。:结合编码器-解码器和空洞空间金字塔池化(ASPP),提升多尺度分割能力。:扩展至点云(如PointNet++)和时序数据(如MaskTrack)。:如SAM(Meta),通过提示(prompt)实现零样本分割。(2001):将分割转化为能量最小化问题,结合颜色和边界信息。:使用SIFT、HOG等特征结合分类器(如SVM)进行分割。原创 2025-04-22 09:04:46 · 787 阅读 · 0 评论 -
unet训练自己的数据集
通过以上步骤,即可完成UNet在自定义数据集上的训练和部署。图像和标签:图像(如.jpg.png)和对应的分割掩膜(mask,需与图像同名且尺寸相同)。目录结构dataset/train/images/ # 训练图像masks/ # 对应的标签val/images/ # 验证图像masks/ # 对应的标签。原创 2025-04-21 11:03:22 · 1389 阅读 · 0 评论 -
DeepLabv3+训练自己的数据集指南
希望这个指南能帮助你成功训练自己的DeepLabv3+模型!使用不同的backbone(如Xception)提高精度。对应的标注图像(PNG格式,每个像素值代表类别ID)类别ID应从0开始连续编号(0,1,2,...)标注图像应为单通道,像素值0通常表示背景。添加数据增强(随机缩放、旋转、颜色变换):减小batch_size或图像尺寸。输入图像(如JPG/PNG格式):尝试降低学习率或使用学习率调度。:增加数据增强或使用正则化技术。使用混合精度训练加速训练过程。:在损失函数中使用类别权重。原创 2025-04-21 10:38:27 · 1150 阅读 · 0 评论 -
unet算法发展历程简介
UNet是一种基于深度学习的图像分割架构,自2015年提出以来经历了多次改进和扩展,逐渐成为医学图像分割和其他精细分割任务的标杆。:对称的U形网络,左侧(编码器)通过下采样提取特征,右侧(解码器)通过上采样恢复空间分辨率。UNet的成功得益于其简洁性、灵活性和可扩展性,未来仍将是图像分割领域的重要基线模型。:空间/通道注意力(如SE模块)、自注意力(Non-local模块)。:将编码器的高分辨率特征与解码器的上采样特征拼接,保留局部细节。处理3D医学图像(如CT、MRI),在解码器中使用3D反卷积。原创 2025-04-18 14:34:40 · 1309 阅读 · 0 评论 -
DeepLab 算法发展历程
DeepLab 系列至今仍是语义分割领域的基石,后续许多工作(如 OCRNet、Mask2Former)均受其启发。:多尺度特征融合显著提升分割精度(PASCAL VOC 2012: 79.7% mIOU)。:DeepLabv3 输出分辨率低(通常为输入尺寸的 1/8),边界模糊。:成为语义分割的标杆模型,支持轻量化(MobileNetV2)和实时应用。:传统 CNN 通过池化(Pooling)降低分辨率,导致空间信息丢失。:自动搜索更优的 DeepLab 结构(如 Auto-DeepLab)。原创 2025-04-18 09:11:13 · 823 阅读 · 0 评论 -
DeepLabv3+ 简介
的架构,在语义分割任务中实现了高精度和鲁棒性,至今仍是工业界和学术界的常用模型。:并行使用不同膨胀率(dilation rate)的卷积,识别不同大小的物体。编码器输出(经过 ASPP)先进行 4 倍上采样,再与主干网络的低层特征融合。模块,显著提升了物体边界的分割精度,同时保持了多尺度上下文信息提取的能力。:支持高性能(ResNet)和轻量化(MobileNet)主干网络。在不降低特征图分辨率的情况下,扩大感受野,捕捉多尺度信息。和高层语义信息,优化分割结果的细节,特别是物体边缘。原创 2025-04-18 09:02:35 · 1376 阅读 · 0 评论
分享