【YOLO v1】模型搭建 | model | 代码

YOLO V1 模型

在这里插入图片描述

import torch
import torch.nn as nn
from torchsummary import summary


def build_block(in_channel, out_channel, kernel_size, stride=1, maxpool=False):
    padding = kernel_size//2
    block = nn.Sequential(nn.Conv2d(in_channel, out_channel, kernel_size=kernel_size, stride=stride, padding=padding, bias=False),
                          nn.BatchNorm2d(out_channel),
                          nn.LeakyReLU(0.1, inplace=True))
    if maxpool:
        block.add_module("maxpool2d", nn.MaxPool2d(kernel_size=2, stride=2))
    return block


class YOLOv1(nn.Module):
    def __init__(self, num_classes=20):
        super(YOLOv1, self).__init__()
        self.num_classes = num_classes
        self.layer1 = nn.Sequential(build_block(3, 64, 7, stride=2, maxpool=True))
        self.layer2 = nn.Sequential(build_block(64, 192, 3, maxpool=True))

        self.layer3 = nn.Sequential(build_block(192, 128, 1),
                                    build_block(128, 256, 3),
                                    build_block(256, 256, 1),
                                    build_block(256, 512, 3, maxpool=True))

        self.layer4 = nn.Sequential(build_block(512, 256, 1),
                                    build_block(256, 512, 3),
                                    build_block(512, 256, 1),
                                    build_block(256, 512, 3),
                                    build_block(512, 256, 1),
                                    build_block(256, 512, 3),
                                    build_block(512, 256, 1),
                                    build_block(256, 512, 3),
                                    build_block(512, 512, 1),
                                    build_block(512, 1024, 3, maxpool=True))

        self.layer5 = nn.Sequential(build_block(1024, 512, 1),
                                    build_block(512, 1024, 3),
                                    build_block(1024, 512, 1),
                                    build_block(512, 1024, 3),
                                    build_block(1024, 1024, 3),
                                    build_block(1024, 1024, 3, stride=2))

        self.layer6 = nn.Sequential(build_block(1024, 1024, 3),
                                    build_block(1024, 1024, 3))

        self.layer7 = nn.Sequential(nn.Flatten(),
                                    nn.Linear(7 * 7 * 1024, 4096, bias=True),
                                    nn.LeakyReLU(0.1),
                                    nn.Dropout(p=0.5),
                                    nn.Linear(4096, 7 * 7 * (self.num_classes + 5 * 2), bias=True),
                                    nn.Sigmoid(),
                                    )

    def forward(self, x):
        x = self.layer1(x)
        x = self.layer2(x)
        x = self.layer3(x)
        x = self.layer4(x)
        x = self.layer5(x)
        x = self.layer6(x)
        x = self.layer7(x)
        x = x.view(-1, 7, 7, self.num_classes + 5 * 2)
        return x


if __name__ == '__main__':
    net = YOLOv1()
    print(summary(net, (3, 448, 448)))

    x = torch.randn((1, 3, 448, 448))
    print(net(x).shape)
### YOLO目标检测代码实现 #### 使用Ultralytics库实现在Python中的YOLO目标检测 为了在Python环境中快速上手并应用YOLO进行目标检测,推荐使用由Ultralytics团队维护的PyTorch版本YOLO模型。此方法不仅简化了安装过程,还提供了简洁易懂的API接口用于加载预训练权重、执行推理等功能。 #### 安装必要的依赖包 确保已安装`pip`工具后,在命令行输入如下指令完成环境搭建: ```bash pip install ultralytics ``` 上述操作会自动下载并配置好运行YOLO所需的全部组件[^1]。 #### 加载模型与图像预测 下面展示一段简单的脚本,演示如何利用官方提供的预训练模型对单张图片实施对象识别任务: ```python from ultralytics import YOLO # 载入预训练好的YOLOv8n模型 model = YOLO('yolov8n.pt') # 对指定路径下的测试图片做推断 results = model('/path/to/image.jpg') # 展示结果 for r in results: boxes = r.boxes # 获取边界框坐标 confidences = r.conf # 得分置信度 class_ids = r.cls # 类别ID print(boxes, confidences, class_ids) ``` 这段程序首先引入了YOLO类定义;接着实例化了一个轻量级的小型网络架构(`yolov8n`)作为工作模型;最后针对给定的一幅静态画面进行了分析处理,并打印出了检测到的目标位置及其类别信息。 对于希望深入研究不同版本YOLO特性或是尝试自定义训练流程的研究者来说,《YOLO目标检测:框架技术原理和代码实现》一书中详细记录了从v1至最新迭代间各代YOLO的设计思路和技术细节,同时给出了多个实际案例供参考学习[^2]。 此外,如果倾向于TensorFlow生态,则可参照特定于该平台上的YOLOV3/V4开源项目文档说明来进行开发实践[^3]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Enzo 想砸电脑

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值