基于Vgg-Unet模型自动驾驶场景检测

最新推荐文章于 2024-09-19 16:29:28 发布

爱因诗贤

最新推荐文章于 2024-09-19 16:29:28 发布

阅读量1.4k

点赞数

文章标签：自动驾驶深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_38937634/article/details/132675159

版权

本文介绍了VGG模型，它源于牛津大学的Visual Geometry Group，常用于人脸识别和图像分类。VGG网络结构固定步长，滤波器大小为3x3或1x1，从VGG11到VGG19不等，包含多个卷积和全连接层。随后，文章提到了Unet模型，这是一个像素级分类的语义分割模型，适合自动驾驶场景的检测。Unet通过结合下采样和上采样路径来实现精确的图像分割。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.VGG

VGG全称是Visual Geometry Group属于牛津大学科学工程系，其发布了一些列以VGG开头的卷积网络模型，可以应用在人脸识别、图像分类等方面,VGG的输入被设置为大小为224x244的RGB图像。为训练集图像上的所有图像计算平均RGB值，然后将该图像作为输入输入到VGG卷积网络。使用3x3或1x1滤波器，并且卷积步骤是固定的。有3个VGG全连接层，根据卷积层+全连接层的总数，可以从VGG11到VGG19变化。最小VGG11具有8个卷积层和3个完全连接层。最大VGG19具有16个卷积层+3个完全连接的层。此外，VGG网络后面没有每个卷积层后面的池化层，也没有分布在不同卷积层下的总共5个池化层。
结构图如下：
在这里插入图片描述
架构图

2.Unet模型：

Unet是一个优秀的语义分割模型，其主要执行过程与其它语义分割模型类似。与CNN不同的之处在于CNN是图像级的分类，而unet是像素级的分类，其输出的是每个像素点的类别
在这里插入图片描述

主要代码如下：

def get_vgg_encoder(input

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。