图像分割项目

海金沙33

于 2025-03-20 10:37:03 发布

阅读量306

点赞数 3

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/2401_82430542/article/details/146389946

版权

图像分割：预测目标的轮廓。将不同的像素划分到不同的类别，非常细粒度的分类。

人像抠图，医学组织提取，遥感图像分析，自动驾驶，材料图像等。

物体Things：可数前景目标(行人等)。· 事物Stuff：不可数背景(天空，草地，路面)。

语义分割：每一个像素必须只能属于一类，预测结果为掩膜。

实例分割：只预测前景目标的类别属性以及边框，个体ID，每一个像素可以属于多个ID。

全景分割：每个像素点分配一个语义类别和一个唯一的实例ID。

图像分割的数据集

· VOC数据集：PASCAL VOC挑战赛(The PASCAL Visual Object Classes)是一个世界级的计算机视觉挑战赛。

VOC 2012：23080图片 /54900目标

VOC数据集：从2007年开始引进了语义分割和实例分割的标注。

VOC数据集：一共2913张图，1464张训练图片，1449张验证图片。

Cityscape数据集：50个城市在春夏秋三个季节不同时间段不同场景、背景的街景图。

Cityscape数据集：30个类别。

Cityscape数据集：5000张精细标注的图像(2975张训练图、500张验证图和1525张测试图)、20000张粗略标注的图像。

COCO数据集：以场景理解为目标，特别选取比较复杂的日常场景。

COCO数据集：共91类，以人类4岁小孩能够辨识为基准，其中82类有超过5000个instance。

语义分割的评估指标

Pixel Accuracy：逐像素分类精度。

· Mean Pixel Accuracy：每个类内被正确分类像素数的比例。

· IoU：前景目标交并比。

· mIoU：每个类的IoU平均值。

· FWIoU：根据每个类出现的概率给mIoU计算权重。

图像分割网络的两个模块

卷积模块：提取特征。

· 反卷积模块：上采样恢复到原图尺度。

转置卷积

卷积输入4*4，输出2*2，卷积核3*3

反卷积输入2*2，输出4*4，卷积核3*3，

卷积与反卷积（转置关系，transposed）

卷积网络：编码器·

反卷积网络：解码器

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。