光_辉
这个作者很懒,什么都没留下…
展开
-
01数据准备 抓取图片 通过爬虫方式获取bing的关键词搜索图片
这就是我们通过链接下载图片的核心思路。我们虽然得到了很多搜索出来的图片,但这里我们虽然需要评估一下搜索引擎搜索出来的结果是否符合预期,但更重要的是关注他上面的链接地址,因为即便搜索效果不好,我们还可以通过下载更多的图片,人工辅助筛选,但如果页面本来就很难去人工构造模拟请求,那么就不好做后续工作了。我们在搜索的结果页面,右键点击鼠标,进入“检查”页面,或者也可以直接进入开发者页面,点击进入元素页面后,我们鼠标在各类元素中移动的时候,上面的页面也会高亮,突出具体的元素对应的位置,我们挨个检查不同的div。原创 2025-02-19 09:37:06 · 161 阅读 · 0 评论 -
00基础环境准备--python环境的准备
选择 Python 环境时,有一些不同的选项,包括直接使用 Python 安装包、使用 Anaconda。原创 2024-07-22 13:40:29 · 137 阅读 · 0 评论 -
00基础环境准备--GPU资源配置
安装完成后,在cmd中运行nvidia-smi命令,可以看到如下提示,证明英伟达显卡的驱动程序已经安装完毕了,其中显卡驱动版本为537.70,可以支持CUDA的最新版本为12.2,对应的,我们就要安装相关版本的CUDA和pytorch。访问https://developer.nvidia.com/cuda-toolkit-archive,下载12.2版本的cuda,如下图所示,我们下载12.2中最新版本的CUDA Toolkit 12.2.2。安装完成后,在系统环境变量中,增加如下两个变量。原创 2023-11-02 18:43:39 · 491 阅读 · 0 评论 -
01素材准备——准备用于标注和训练的图片素材——使用simple_image_download工具下载
笔者为大家推荐一款python工具,叫做simple_image_download,这个第三方库可以直接用几行脚本调用google搜索关键词图片,并且下载下来。simple_image_download是一个Python包,它可以让你使用关键词从Google图片下载图片。你也可以使用它来获取图片的URL而不下载它们。它是一个有用的工具,可以用于各种目的,比如机器学习,数据分析,或者网页开发。你可以使用pip或者从GitHub下载源代码来安装它。原创 2023-08-21 13:06:17 · 374 阅读 · 0 评论 -
01素材准备——准备用于标注和训练的图片素材——从视频监控视频中生成图片素材
通过上述方法,便可通过视频抽帧的形式快速生成大量的素材图片了,便于我们进一步开展标注和训练工作。原创 2023-08-21 13:51:29 · 1143 阅读 · 0 评论 -
02标签准备——labelIMG工具使用
当我们已经准备了大量用于图片标注所需的图片后,便需要使用labelIMG工具进行打标签的操作了。原创 2023-08-21 15:20:52 · 467 阅读 · 0 评论 -
03标签丰富——labelIMG工具使用——自动化标注
在实际生产项目中,为了提升目标识别的准确性,我们往往需要3000-5000张图片进行标注。而直接参与过标注的人都有一个共同的感觉,就是标注是一个简单、枯燥、无聊且十分耗时费力的差事。为此,我们可以在有了初步训练模型的基础上,采用更加自动化的方式进行标注,届时,你讲不用每个照片、每个目标的重复标注,而是直接在现有模型对图片进行识别后的结果上进行调整标注或者新增标注。本章节,笔者将重点围绕使用labelIMG进行自动化高效率的标注进行讲解。原创 2023-08-17 18:10:35 · 6830 阅读 · 4 评论 -
04训练——基于YOLO V8的自定义数据集训练——使用免费在线GPU资源
Colab 是一个由 Google Research 团队开发的在线平台,可以让你在浏览器中编写和运行 Python 代码,无需任何配置,免费使用 GPU 和 TPU,还可以方便地与其他人共享你的工作。Google Colab 适合进行机器学习、数据分析和教育等目的。其主要特点有:• 零配置:你只需要一个 Google 账号和一个浏览器,就可以开始使用 Google Colab,无需安装任何软件或硬件。原创 2023-08-23 18:57:49 · 5104 阅读 · 1 评论 -
04训练——基于YOLO V8的自定义数据集训练——在windows环境准备
为此,在我们实际的项目需求中,仍然需要掌握如何在windows环境下,调用本地电脑的GPU资源进行模型的训练。三是免费使用gpu的额度有限制,也就是说当你频繁使用colab做训练的时候,会提示配额已满,甚至我们耗费很长时间进行训练的时候,突然运行报错,实际上就是配额慢了,造成前期工作白费了。在上述步骤完成之后,便可调用本地电脑的GPU资源了,具体的代码与基于linux环境的colab上运行的代码类似,但有些许不同,笔者将逐一讲解。一是需要通过虚拟服务器做为跳板机来访问,总体操作起来非常繁杂。原创 2023-10-09 08:48:45 · 1042 阅读 · 0 评论 -
04训练——基于YOLO V8的自定义数据集训练-----windows环境下训练代码
在下面代码中,为了更高效,本人使用了yolov8s这一个轻量级模型,我们可以查看官网上各类模型在目标识别方面的性能对比情况,大家可以结合实际使用更大的模型从而追求更好的效果。于前面讲的在colab中的代码不同,因为colab本质上是linux环境,linux环境和windows环境下对多进程的调用方法不同,在参数上,需要增加amp=False,这是因为不加这个参数的话,会出现Nan Loss的情况,导致训练异常,得到的模型无法检测到目标。windows环境下需要增加“if。windows环境下训练代码。原创 2023-11-06 19:36:36 · 317 阅读 · 0 评论 -
04训练——基于YOLO V8的自定义数据集训练——训练结果说明
PR_curve 是 P-R 曲线的简称,它是精确率和召回率之间的关系曲线,精确率表示预测为正类的样本中有多少是真正的正类,召回率表示真正的正类中有多少被预测为正类。当你看到如下图所示的结果,就证明训练已经结束,并且可以在左侧文件夹中找到生成的weights文件夹,其中的best.pt就是生成的效果最好的模型文件,last.pt是生成的训练到当前状态最新的模型文件。例如,all类别的mAP50-95是0.316,表示整个模型在测试集上按照IOU从0.5到0.95的不同标准,目标检测的平均精度是31.6%。原创 2023-10-08 18:53:06 · 3627 阅读 · 1 评论 -
05预测识别-依托YOLO V8进行训练模型的识别——对视频中的图片进行识别
在前面的一些章节中,我们已经讲如何准备打标签的素材、如何制作标签、如何训练以及得到我们最终需要的用于YOLO目标识别的模型。那么现在我们就要正式开始,利用我们训练得到的best.pt,这个模型文件来对图片视频进行识别。原创 2023-09-21 15:37:36 · 1793 阅读 · 2 评论 -
05预测识别-依托YOLO V8进行训练模型的识别——对视频中的目标进行跟踪统计
上文中详细介绍了如何对视频进行抽帧,并对帧的图像进行目标识别。但在日常工作中,我们也会遇到需要对目标进行跟踪统计的情况,比如我们需要连续统计某一类目标有多少个的时候,如果单纯从帧中抽取图像的话,系统将无法判断是否为同一目标,从而造成目标数量统计的重复,导致结果不准确或者远远脱离正常水平。这就需要我们掌握对目标做动态跟踪的程序实现方法,从而更为准确的统计目标数量。原创 2023-11-08 13:01:02 · 1073 阅读 · 0 评论 -
06视频推流测试——使用ffmpeg进行推流生成rtsp视频流
在我们完成开发工作之后,需要通过推流的形式来验证能否正确接收视频流,并送入视频检测程序。笔者在这里使用的是业内最为常用的ffmpeg。具体方法如下。原创 2023-09-11 10:39:54 · 1838 阅读 · 0 评论 -
07程序发布——使用pyinstaller打包识别程序为exe可执行文件 详解
pyinstaller是一个Python程序打包工具,它可以将Python脚本和相关的依赖文件打包成一个可执行文件,从而方便在没有安装Python的环境中运行。除了常用的pyinstaller之外,还有一款auto-py-to-exe这个第三方库也可以将python脚本进行打包,它就是pyinstaller的视窗版本,是基于pyinstaller做为底层来开发实现的。本节将重点介绍pyinstaller的基本使用。原创 2023-09-04 14:02:05 · 757 阅读 · 0 评论