1. 项目背景
本项目旨在通过使用YOLO(You Only Look Once)算法完成计算机视觉竞赛的Task1。YOLO是一种基于深度学习的目标检测算法,具有实时性强、准确率高的特点,适用于自动驾驶、安防监控等领域。本文档详细记录了该项目的实施过程,从数据集的准备到模型的训练和测试,并讨论了每个步骤中的关键技术细节。
2. 项目环境配置
在开始项目之前,首先需要配置开发环境。本项目使用了Python 3.8,并且依赖以下主要库:
torch
:用于深度学习模型的构建和训练numpy
:用于数值计算opencv-python
:用于图像处理matplotlib
:用于可视化
!/opt/miniconda/bin/pip install opencv-python pandas matplotlib ultralytics
!apt install zip unzip -y
!apt install unar -y
这些命令确保你可以处理视频、图片、数据并运行YOLOv8模型。
然后导入库:
import os, sys
import cv2, glob, json
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
然后,下载并解压训练集和测试集数据。
!wget "https://comp-public-prod.obs.cn-east-3.myhuaweicloud.com/dataset/2024/%E8%AE%AD%E7%BB%83%E9%9B%86%28%E6%9C%89%E6%A0%87%E6%B3%A8%E7%AC%AC%E4%B8%80%E6%89%B9%29.zip?AccessKeyId=583AINLNMLDRFK7CC1YM&Expires=1739168844&Signature=9iONBSJORCS8UNr2m/VZnc7yYno%3D" -O 训练集\(有标注第一批\).zip
!unar -q 训练集\(有标注第一批\).zip
!wget "https://comp-public-prod.obs.cn-east-3.myhuaweicloud.com/dataset/2024/%E6%B5%8B%E8%AF%95%E9%9B%86.zip?AccessKeyId=583AINLNMLDRFK7CC1YM&Expires=1739168909&Signature=CRsB54VqOtrzIdUHC3ay0l2ZGNw%3D" -O 测试集.zip
!unar -q 测试集.zip
3数据处理
接下来,我们读取训练集中的标注