yolov目标识别检测

1.YOLO (You Only Look Once)
- 优点：快速、高效，适用于实时目标检测任务。
- 缺点：对小目标检测效果可能不佳，定位精度相对较低。
2.Faster R-CNN (Region-based Convolutional Neural Networks)
- 优点：较准确，适用于小目标检测和复杂场景。
- 缺点：速度较慢，不适合实时应用。
3.SSD (Single Shot MultiBox Detector)
- 优点：速度快，适用于实时目标检测。
- 缺点：对小目标检测效果可能不如 Faster R-CNN。

这些算法在不同场景和任务需求下有各自的优势和限制，选择合适的算法取决于具体的应用需求和数据特点。在实际应用中，需要根据具体情况选择最适合的算法来解决问题。下面给出一个视频检测示例

二、检测一个视频的代码

1. 导入必要的库

import cv2
from ultralytics import YOLO

2. 加载预训练的 YOLOv8 模型

model = YOLO("yolov8n.pt")
# 在这里，使用了 Ultralytics 提供的 YOLO 类加载了预训练的 YOLOv8 模型。

3. 获取模型预测的类别名称列表

classnameList = model.names
print(classnameList)

获取模型预测的类别名称列表，这些类别名称将用于在图像上显示检测结果的标签。

4. 打开视频文件

video_path = 'jiaoto.mp4'
cap = cv2.VideoCapture(video_path)

通过 OpenCV 的 VideoCapture 函数打开视频文件。

5. 视频处理循环

while True:
    ret, frame = cap.read()

    if not ret:
        break

    results = model.predict(frame)

在循环中读取视频帧，如果视频帧读取失败则退出循环，然后使用 YOLO 模型对当前帧进行目标检测。

6. 处理检测结果并绘制边界框

for result in results:
    boxes = result.boxes.cpu().numpy()

    for box in boxes:
        r = box.xyxy[0].astype(int)

        cv2.rectangle(frame, (r[0], r[1]), (r[2], r[3]), (0, 255, 0), 2)

        classID = box.cls[0]
        label = classnameList[classID]

        x = max(r[0] - 10, 10)
        y = max(r[1] - 10, 10)
        cv2.putText(frame, label, (x, y), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 255, 255), 2)

遍历每个检测结果，提取边界框信息并绘制边界框，然后获取类别名称并在边界框附近绘制类别标签。

7. 显示带有检测结果的视频帧

cv2.imshow('Detection Results', frame)

if cv2.waitKey(1) & 0xFF == ord('q'):
    break

显示带有检测结果的视频帧，并通过按下 'q' 键来退出循环。

8. 释放资源

cap.release()
cv2.destroyAllWindows()

释放视频流并关闭窗口，完成整个处理过程。

这段代码结合了 YOLOv8 模型和 OpenCV 库，实现了实时目标检测并在视频帧上展示检测结果。

三、优化界面

我们结合上面的代码，以下是“检测一个视频”的界面详细实现过程：

import sys
import cv2
import numpy as np
from PyQt5.QtWidgets import QApplication, QMainWindow, QPushButton, QVBoxLayout, QWidget, QFileDialog
from PyQt5.QtCore import Qt

class VideoDetectionApp(QMainWindow):
    def __init__(self):
        super().__init__()
        self.initUI()

    def initUI(self):
        self.setWindowTitle('视频目标检测')
        self.setGeometry(100, 100, 800, 600)

        # 创建按钮
        self.btn_select_video = QPushButton('检测一个视频', self)
        self.btn_select_video.setGeometry(300, 250, 200, 50)

        # 连接按钮到函数
        self.btn_select_video.clicked.connect(self.select_video)

    def select_video(self):
        # 选择视频文件
        file_name, _ = QFileDialog.getOpenFileName(self, "检测一个视频", "", "Video Files (*.mp4 *.avi)")
        if file_name:
            self.detect_objects(file_name)

    def detect_objects(self, video_path):
        # 加载YOLO模型
        net = cv2.dnn.readNet('yolov3.weights', 'yolov3.cfg')
        classes = []
        with open('coco.names', 'r') as f:
            classes = [line.strip() for line in f.readlines()]

        # 打开视频文件
        cap = cv2.VideoCapture(video_path)
        if not cap.isOpened():
            print("Error: Could not open video.")
            return

        # 视频目标检测
        while True:
            ret, frame = cap.read()
            if not ret:
                break

            # 使用YOLO模型进行目标检测
            blob = cv2.dnn.blobFromImage(frame, 1/255, (416, 416), swapRB=True, crop=False)
            net.setInput(blob)
            outputs = net.forward(net.getUnconnectedOutLayersNames())

            # 在帧上绘制边界框和标签
            for output in outputs:
                for detection in output:
                    scores = detection[5:]
                    class_id = np.argmax(scores)
                    confidence = scores[class_id]
                    if confidence > 0.5:
                        center_x = int(detection[0] * frame.shape[1])
                        center_y = int(detection[1] * frame.shape[0])
                        width = int(detection[2] * frame.shape[1])
                        height = int(detection[3] * frame.shape[0])

                        x = center_x - width // 2
                        y = center_y - height // 2

                        cv2.rectangle(frame, (x, y), (x + width, y + height), (0, 255, 0), 2)
                        cv2.putText(frame, classes[class_id], (x, y - 5), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2)

            # 显示带有检测结果的视频帧
            cv2.imshow('Video Detection', frame)

            # 按'q'键退出
            if cv2.waitKey(1) & 0xFF == ord('q'):
                break

        # 释放视频捕获对象和销毁所有窗口
        cap.release()
        cv2.destroyAllWindows()

if __name__ == '__main__':
    app = QApplication(sys.argv)
    window = VideoDetectionApp()
    window.show()
    sys.exit(app.exec_())

1创建按钮

在initUI方法中，创建了一个名为btn_select_video的按钮，用于触发视频检测功能。按钮的文本设置为“检测一个视频”，并且它的位置和大小被设置在窗口的特定位置。

2连接按钮到函数

使用clicked.connect(self.select_video)将按钮的点击事件连接到select_video函数。这意味着当用户点击按钮时，select_video函数将被调用。

3选择视频文件

在select_video函数中，使用QFileDialog.getOpenFileName方法打开一个文件选择对话框，让用户选择一个视频文件。对话框的标题设置为“检测一个视频”，默认目录为当前目录，文件过滤器设置为只显示视频文件（如.mp4和.avi）。

4调用检测函数

如果用户选择了视频文件，select_video函数将调用detect_objectss函数，并将视频文件的路径作为参数传递给它。

5视频目标检测

在detect_objectss函数中，首先加载YOLO模型，并获取模型识别的类别名称列表。然后使用cv2.VideoCapture打开视频文件。如果视频文件无法打开，将打印错误信息并返回。接下来，进入一个循环，读取视频的每一帧，并对每一帧使用YOLO模型进行目标检测。对于每一帧，获取检测到的目标框和类别ID，然后在帧上绘制边界框和标签。使用cv2.imshow显示带有检测结果的视频帧。如果用户按下'q'键，循环将终止，释放视频捕获对象和销毁所有窗口。