图像分割项目

小名叫咸菜

于 2025-03-20 10:40:55 发布

阅读量397

点赞数 5

文章标签：机器学习人工智能图像处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/2402_88408747/article/details/146389485

版权

图像分割

图像分割：预测目标的轮廓。将不同的像素划分到不同的类别，非常细粒度的分类。

应用场景:人像抠图，医学组织提取，遥感图像分析，自动驾驶，材料图像等。

图像分割的前景和背景:物体Things：可数前景目标(行人等)、事物Stuff：不可数背景(天空，草地，路面)

图像分割的三层境界

语义分割(semantic segmentation)：每一个像素必须只能属于一类，预测结果为掩膜。

实例分割(instance segmentation)：只预测前景目标的类别属性以及边框，个体ID，每一个像素可以属于多个ID。

全景分割(panoptic segmentation)：每个像素点分配一个语义类别和一个唯一的实例ID。

图像分割的数据集

VOC数据集：PASCAL VOC挑战赛(The PASCAL Visual Object Classes)是一个世界级的计算机视觉挑战赛。

4大类，20小类

VOC 2007：9963图片 /24640目标

VOC 2012：23080图片 /54900目标

VOC数据集：从2007年开始引进了语义分割和实例分割的标注。

VOC数据集：一共2913张图，1464张训练图片，1449张验证图片。

Cityscape数据集：50个城市在春夏秋三个季节不同时间段不同场景、背景的街景图。

30个类别

5000张精细标注的图像(2975张训练图、500张验证图和1525张测试图)、20000张粗略标注的图像

语义分割和实例分割

COCO数据集：共91类，以人类4岁小孩能够辨识为基准，其中82类有超过5000instance。

COCO数据集：以场景理解为目标，特别选取比较复杂的日常场景。

COCO数据集：数据集图像特点

语义分割的评估指标

Pixel Accuracy：逐像素分类精度。

Mean Pixel Accuracy：每个类内被正确分类像素数的比例。

IoU：前景目标交并比。

mIoU：每个类的IoU平均值。

FWIoU：根据每个类出现的概率给mIoU计算权重。

图像分割网络的两个模块

卷积模块：提取特征。

反卷积模块：上采样恢复到原图尺度。

转置卷积

卷积

卷积实现

反卷积

反卷积实现

卷积与反卷积（转置关系，transposed）

卷积网络：编码器

反卷积网络：解码器

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。