自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

深度学习算法工程师,专注于前沿算法研究与实战应用。在这里,我将分享深度学习领域的实战经验、优质数据集资源以及最新论文解读与精度分析,旨在与广大技术爱好者共同探索人工智能的奥秘,助力技术成长与创新。

欢迎来到我的深度学习技术世界!作为一名深度学习算法工程师,我致力于通过代码与模型探索智能的边界。在本博客中,你将找到: 算法实战:从基础到前沿,分享深度学习算法的实战案例与实现细节,带你领略算法的魅力与应用潜力。

  • 博客(9)
  • 资源 (5)
  • 收藏
  • 关注

原创 基于yolo11的CrowdHuman密集行人目标检测实战文档(yolo格式数据免费获取)

在拥挤/遮挡场景下,使用crowdhuman数据集重训练后的yolo11,效果表现较好。CrowdHuman数据集是旷世发布的用于行人检测的数据集,图片数据大多来自于google搜索。CrowdHuman数据集数据量比较大,训练集15000张,测试集5000张,验证集4370张。

2025-02-11 10:50:15 829

原创 深度学习论文解析(一):MOCS建筑工地中移动目标检测的数据集和基准

本文提出了一个名为“建筑工地移动物体”(MOCS)的图像数据集,旨在为建筑工地中的移动物体检测提供大规模、多样化的数据支持。MOCS数据集中的图像来自174个不同的建筑工地,涵盖了建筑、桥梁、隧道、高速公路、大坝等多种类型的工程项目。现有的公开数据集如Pascal VOC、COCO等主要用于自然场景中的物体检测和实例分割,而针对建筑工地的数据集较少。MOCS数据集标注了13类移动物体,包括工人、塔吊、卡车、挖掘机等。未来的工作包括丰富数据集的标注、扩展数据集的类别和场景,以及开发更多类型的建筑工地数据集。

2025-02-07 14:02:03 789

原创 基于yolo11的饮料垃圾目标检测实战文档(yolo格式数据免费获取)

饮料垃圾数据集是一个用于目标检测任务的数据集。该数据集的可能应用领域为环境产业。

2025-04-01 15:19:19 786

原创 基于yolo11的水果柑橘目标检测实战文档(yolo格式数据免费获取)

水果柑橘数据集是一个用于目标检测任务的数据集。该数据集的可能应用领域为农业。

2025-04-01 15:07:57 949

原创 深度学习论文解析(三):ConRebSeg用于施工场景的钢筋混凝土语义分割数据集

提供了一个包含14,805张RGB图像的数据集,这些图像带有分割标签,用于自主机器人检查钢筋混凝土缺陷。为YOLOv8L-seg、DeepLabV3和U-Net分割模型建立了基线。

2025-02-14 17:48:36 837

原创 基于yolo11-seg的水果桃子语义分割实战文档(yolo格式数据免费获取)

数据集的多样性和挑战性使得基于该数据集训练的模型能够更好地适应不同的农业场景,从而提高模型的泛化能力,减少对特定果园环境或数据集的依赖。Peach桃子语义分割数据集,按照7:1:2的比例划分为训练集、验证集、测试集,并组织好yolo算法所需的目录结构。

2025-02-12 21:12:10 1100

原创 深度学习论文解析(二):SODA用于建筑工地的大规模开放场地目标检测数据集

构建用于深度学习目标检测的综合图像数据集对建筑业意义重大,但创建难度大。本文开发并公开了名为 Site Object Detection Dataset (SODA) 的大规模建筑工地图像数据集,包含 15 个物体类别,从多个工地不同场景收集超 20,000 张图像。统计分析显示其多样性和规模良好,用两种深度学习目标检测算法评估,最高平均精度均值(mAP)达 81.47%,为建筑业提供了数据集并建立了算法评估基准。

2025-02-08 17:22:39 983

原创 Win10—YOLOv5实战+TensorRT部署+VS2019编译(小白教程~易懂易上手)---超详细

Win10—YOLOv5实战+TensorRT部署+VS2019编译(小白教程~易懂易上手)一位入门CV的小白,第一次使用TensorRT来加速部署YOLOv5项目。此文详细记录了实操过程中的种种坑与不足,一来方便自己回顾温习,二来帮助想使用YOLOv5与TensorRT来部署项目的小伙伴避免踩一些坑,三来希望得到各位大佬大牛的高见!文章目录Win10—YOLOv5实战+TensorRT部署+VS2019编译(小白教程~易懂易上手)1 软件下载及安装(1) 安装VS2019(2) 安装NVID

2021-08-30 12:45:20 13747 13

原创 YOLOv5实战+TensorRT部署---环境配置及软件下载

YOLOv5项目的TensorRT加速部署---环境配置 在Win10系统上利用TensorRT来加速部署YOLOv5项目,需要用到的软件与依赖包有:cuda 10.2 , cudnn 7.6.5 , VS2019 , OpenCV 3.4.0 , Anaconda3 , CMake 3.19.4 , TensorRT 7.0.0.11 , YOLOv5-V4.0软件环境与依赖库 打包下载: 结合教程《Win10—YOLOv5实战+TensorRT部署+VS2019编译(小白教程~易懂易上手)》

2021-08-30 12:36:23 1155

WizardCoder代码大语言模型论文研读+原理解析

《WizardCoder: Empowering Code Large Language Models with Evol-Instruct》代码大语言模型论文研读 Architecture:Decoder-Only Model Size:15B Evol-Instruct:1) Streamlined the evolutionary instructions by removing deepening, complicating input, and In-Breadth Evolving. 2) Simplified the form of evolutionary prompts by unifying the evolutionary prompt template. Huggingface:https://huggingface.co/WizardLM/WizardCoder-15B-V1.0

2023-08-03

Yolov5结构图展示清晰易懂

YOLOv5算法本身非常优秀,随着其版本的迭代更新,网络各个模块对物体检测中的常见问题都做了一定的优化改进,本身就具有较好的工程实用性。 Input部分完成数据增强、自适应图片缩放、锚框计算等基本处理任务;Backbone部分作为主干网络,主要使用CSP结构提取出输入样本中的主要信息,以供后续阶段使用;Neck部分使用FPN及PAN结构,利用Backbone部分提取到的信息,加强特征融合;Prediction部分做出预测,并计算CIOU_Loss等损失值。 随着计算机视觉技术的不断发展,目标检测领域里的各种算法技术层出不穷,针对不同事物不同目标,我们需进行多方比较,进而择优选择。其中,YOLOv5算法,得益于速度快精度高而闻名,是一种经典且稳定的算法。 此份结构图,有助于大家了解yolov5模型的整体框架与架构,帮助大家理清原理熟悉源码设计。

2023-08-03

Linux常用命令及操作技巧汇总

Linux版本,重要概念;使用终端,帮助命令和用法;文件与目录管理;文件查看命令,打包和压缩;权限管理设定。 重要部分:1)Vim文本编辑器:vim的设计理念是命令的组合。我们可以学习各种各样的文本间移动或跳转的命令和其他的普通模式的编辑命令;同时VIM与很多快捷键设置和正则表达式类似,可以辅助记忆。2)文本与文件查找:grep和find命令将会很便利。3)系统管理篇:服务状态的查询命令,服务配置文件的缩写,访问控制方式分类以及源代码编译安装等。4)硬盘分区:链接文件及挂载命令等;5)BASH方面:Shell脚本的如何使用,内部命令与外部命令;6)进程与内存的查看和调整,变量与环境变量查看;7)循环函数与正则表达式等基础语法。 样例展示:rm表示删除文件或目录,cp为复制文件或目录,ps来列出系统进程快照,kill用于终止进程,netstat实现展示系统网络连接和路由表信息,ping进行网络连接和延迟测试,tail可以显示文本文件尾部的行等。

2023-08-03

OCR基础之网络详解(文字检测+文字识别)

文字识别也是图像领域一个常见问题。然而,对于自然场景图像,首先要定位图像中的文字位置,然后才能进行识别。 所以一般来说,从自然场景图片中进行文字识别,需要包括2个步骤: 文字检测:解决的问题是哪里有文字,文字的范围有多少 文字识别:对定位好的文字区域进行识别,主要解决的问题是每个文字是什么,将图像中的文字区域进转化为字符信息。 CTPN是在ECCV 2016提出的一种文字检测算法。CTPN结合CNN与LSTM深度网络,能有效的检测出复杂场景的横向分布的文字,效果如下图,是目前比较好的文字检测算法。 现今基于深度学习的端到端OCR技术有两大主流技术:CRNN OCR和attention OCR。其实这两大方法主要区别在于最后的输出层(翻译层),即怎么将网络学习到的序列特征信息转化为最终的识别结果。这两大主流技术在其特征学习阶段都采用了CNN+RNN的网络结构,CRNN OCR在对齐时采取的方式是CTC算法,而attention OCR采取的方式则是attention机制。本部分主要介绍应用更为广泛的CRNN算法。

2023-07-06

深度学习抠图Composition-1k数据集

Adobe composition-1k数据集只包含alpha和fg(以及测试集中的trimap)。 文件内容包括如下: ├── adobe_composition-1k │ ├── Test_set │ │ ├── Adobe-licensed images │ │ │ ├── alpha │ │ │ ├── fg │ │ │ ├── trimaps │ ├── Training_set │ │ ├── Adobe-licensed images │ │ │ ├── alpha │ │ │ ├── fg │ │ ├── Other │ │ │ ├── alpha │ │ │ ├── fg 总的来说,数据集文件收集不易,但是完整的,总共体积大小为410MB左右,如果要合成图像的话还需要经过后续转换步骤,涉及COCO训练数据和VOC测试数据。

2023-04-14

《计算机视觉与图像处理》学习资料

计算机视觉与图像处理: 只需要基础的Python编程知识,了解Pytorch、TensorFlow等框架 就可以学些,有利于找工作就业。 1.涉及单阶段、双阶段目标检测算法、Deeplabv3+图像分割算法、服务端模型与移动端模型部署实战;2.算法原理及源码讲解、加速方法/技巧;3.三大项目实战,训练推理及部署落地等;4.《无人驾驶车道线分割》、《口罩实时检测》、《活体人脸身份识别》等应用,及输出C/C++的.so文件。

2022-07-12

TensorRT-7.2.2.3.Ubuntu-18.04.x86_64-gnu.cuda-11.0.cudnn8.0

TensorRT-7.2.2.3.Ubuntu-18.04.x86_64-gnu.cuda-11.0.cudnn8.0.tar.gz,安装tensorRT源码,适合cuda版本11.0 cudnn版本8.0

2022-05-15

YOLOv5实战+TensorRT部署+VS2019编译[全部软件下载]

使用TensorRT来加速部署YOLOv5项目,此文档中包含全部 软件及依赖库 在Win10系统上完成,需要用到的软件与依赖包有:cuda 10.2 , cudnn 7.6.5 , VS2019 , OpenCV 3.4.0 , Anaconda3 , CMake 3.19.4 , TensorRT 7 安装使用使用教程:https://blog.youkuaiyun.com/weixin_39588099/article/details/119994675?spm=1001.2014.3001.5502

2021-08-30

TensorRT-7.0.0.11.Ubuntu-16.04.x86_64-gnu.cuda-10.2.cudnn7.6

TensorRT-7.0.0.11.Ubuntu-16.04.x86_64-gnu.cuda-10.2.cudnn7.6.tar.gz 下载

2021-08-24

TensorRT-7.0.0.11.Windows10.x86_64.cuda-10.0.cudnn7.6.zip

TensorRT-7.0.0.11.Windows10.x86_64.cuda-10.0.cudnn7.6.zip 下载

2021-08-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除