2024小白YOLO-World部署（Ultralytics版本）

原创已于 2025-04-12 13:45:53 修改 · 4.6k 阅读

·

28

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#YOLO #人工智能

于 2024-11-23 17:28:46 首次发布

该文章已生成可运行项目，

目录

一、前置环境搭建

1.Pytorch的安装

二、YOLO-World使用

1.下载Ultralytics

2.下载依赖环境

3.下载YOLO-World权重

（1）不指定特定检测类

（2）指定检测类

前言

本篇主要介绍，最近新出的YOLO-World如何在Ultralytics中简单使用。由于楼主也是小白，如果错误地方欢迎大家指正。

一、前置环境搭建

1.Pytorch的安装

由于本文是在Ultralytics版本上使用YOLO-World所以我们要先下载好Pytorch，才能使用。详细安装过程参考如下文章：

2024小白安装Pytorch-GPU版（Anaconda，CUDA，cuDNN讲解）_pytorch安装-优快云博客

学会了上面内容之后，我们需要创建一个新的虚拟环境（安装好Pytorch）用于使用YOLO-World。

二、YOLO-World使用

1.下载Ultralytics

其实就是YOLO系列的框架，在GitHub上下载好，解压完用Pycharm打开

GitHub - ultralytics/ultralytics: Ultralytics YOLO11 🚀

2.下载依赖环境

先在设置里的Python解释器选择我们新创建好的虚拟环境，再配置下终端，方便再Pycharm中直接进入虚拟环境，安装YOLO-World需要的依赖包（不会的参考YOLO系列部署）

2024小白部署YOLOv8_dnf yolov8-优快云博客

然后在终端输入指令下载需要的依赖环境

pip install ultralytics

3.下载YOLO-World权重

第一个链接是YOLO-World的GitHub源码地址链接，里边有不同的权重文件

GitHub - AILab-CVC/YOLO-World: [CVPR 2024] Real-Time Open-Vocabulary Object Detection

这里楼主选用yolov8s-world.pt（下载好后直接放下根目录下即可），需要其他权重，去上边链接下载

https://github.com/ultralytics/assets/releases/download/v8.1.0/yolov8s-world.pt

4.检测使用（不含训练，只检测coco中有的80类）

（1）不指定特定检测类

在根目录下创建一个新的python文件，复制下边代码放进去。直接运行即可。

from ultralytics import YOLOWorld
 
# 加载模型  放你下载好的YOLOWorld权重文件路径
model = YOLOWorld('yolov8s-world.pt')  
 
# 推理预测   选择一张图片，放你图片路径
results = model.predict('data/images/bus.jpg')
 
# 显示结果
results[0].show()

检测结果如下：

（2）指定检测类

指定检测类，就涉及了文本embedding的模块，需要用到CLIP，在终端安装clip

pip install openai-clip

然后使用下面代码运行，即可

from ultralytics import YOLOWorld
 
# Initialize a YOLO-World model
model = YOLOWorld('yolov8s-world.pt')  # or choose yolov8m/l-world.pt
 
# Define custom classes      这里设置指定检测的类
model.set_classes(["person"])
 
# Execute prediction for specified categories on an image
results = model.predict('data/images/bus.jpg')
 
# Show results
results[0].show()

检测结果如下：

总结

由于网上目前关于这部分内容比较少，等楼主多探索下，再回来分享下其他学到的东西，祝大家学习愉快！

本文章已经生成可运行项目

评论 3

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。