李沐46_语义分割和数据集——自学笔记

Rrrrrr900

于 2024-04-17 16:29:15 发布

阅读量625

点赞数 8

文章标签：深度学习人工智能 pytorch 卷积神经网络语义分割 VOC

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Rrrrrr900/article/details/137878223

版权

语义分割

语义分割将图片中的每个像素分类到对应的类别。

实例分割（目标检测的进化版本）

如果有物体，会区别同一类的不同物体。

语义分割重要数据集：Pascal VOC2012

%matplotlib inline
import os
import torch
import torchvision
from d2l import torch as d2l

下载数据集VOC，大小2GB，类型tar

d2l.DATA_HUB['voc2012'] = (d2l.DATA_URL + 'VOCtrainval_11-May-2012.tar',
                           '4e443f8a2eca6b1dac8a6c57641b67dd40621a49')

voc_dir = d2l.download_extract('voc2012', 'VOCdevkit/VOC2012')

Downloading ../data/VOCtrainval_11-May-2012.tar from http://d2l-data.s3-accelerate.amazonaws.com/VOCtrainval_11-May-2012.tar...

读取输入的图像和标签

def read_voc_images(voc_dir, is_train=True):
    """读取所有VOC图像并标注"""
    txt_fname = os.path.join(voc_dir, 'ImageSets', 'Segmentation',
                             'train.txt' if is_train else 'val.txt')
    mode = torchvision.io.image.ImageReadMode.RGB
    with open(txt_fname, 'r') as f:
        images = f.read().split()
    features, labels = [], []
    for i, fname in enumerate(images):
        features.append(torchvision.io.read_image(os.path.join(
            voc_dir, 'JPEGImages', f'{
     fname}.jpg')))
        labels.append(torchvision.io.read_image(os.path.join(
            voc_dir, 'SegmentationClass' ,f'{
     fname}.png'), mode))
    return features, labels

train_features, train_labels = read_voc_images(voc_dir, True)

下面我们绘制前5个输入图像及其标签。在标签图像中，白色和黑色分别表示边框和背景，而其他颜色则对应不同的类别

n = 5
imgs = train_features[0:n] + train_labels[0:n]
imgs = [img.permute(1,2,0) for img in imgs]
d2l.show_images(imgs, 2, n);

在这里插入图片描述

列举RGB颜色值和类名


VOC_COLORMAP =

最低0.47元/天解锁文章

博客等级

码龄6年

64
原创

834
点赞

450
收藏

693
粉丝

关注

私信

热门文章

最新评论

李沐16神经网络基础——自学笔记
优快云-Ada助手: 恭喜作者发布了第14篇博客！不断学习和分享知识是非常值得赞赏的。建议下一步可以尝试深入探讨一些实际案例，结合自己的理解和经验，给读者更多启发和思考。希望您能继续坚持创作，加油！谦虚谨慎地学习和分享是我们不断成长的不竭动力。
李沐测试15-California房价预测测试
优快云-Ada助手: 恭喜李沐测试15在博客中分享了关于California房价预测的测试内容！持续创作是提升自己技能的不二选择，相信您的努力一定会有所收获。希望在下一篇博客中，可以深入探讨一些实际案例，或者结合更多的数据分析方法，以丰富内容吸引更多读者的关注。期待您的下一篇作品！加油！
李沐14数值稳定性_模型初始化和激活函数——自学笔记
优快云-Ada助手: 恭喜用户在自学笔记中分享了关于李沐14数值稳定性、模型初始化和激活函数的内容。持续创作对于个人学习和分享经验都是非常有益的，希望您能继续坚持下去，为更多人带来知识的启发和帮助。建议您在下一篇博客中可以深入探讨一些实际案例，结合具体的应用场景进行分析，这样可以让读者更加直观地理解相关概念。期待您的更多精彩内容！
李沐15实战Kaggle比赛_预测房价——自学笔记
优快云-Ada助手: 恭喜您发布了第12篇博客！看到您在自学笔记中分享了李沐15实战Kaggle比赛预测房价的经验，让人深感佩服。希望您能继续坚持创作，不断提升自己的技术水平。下一步，可以考虑分享更多具体的数据分析案例，或者挑战更多不同领域的Kaggle比赛，拓展自己的技术视野。期待看到您更多精彩的文章！
李沐06 矩阵计算
优快云-Ada助手: 恭喜用户写了第三篇博客，标题为“李沐06 矩阵计算”！持续创作是提升自己的最好方式，希望用户能够坚持下去，不断分享自己的学习和经验。下一步建议可以尝试写一些实践性更强的文章，比如结合具体案例进行分析和总结，这样能够更好地帮助读者理解和应用知识。期待用户更加优秀的作品！愿用户在创作的路上越走越远！优快云正在通过评论红包奖励优秀博客，请看红包流：https://bbs.youkuaiyun.com/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。