自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(123)
  • 资源 (2)
  • 问答 (5)
  • 收藏
  • 关注

原创 基于 DeepSeek 构建智能语音聊天机器人

本文将深入探讨如何利用 DeepSeek 实现一个具备语音识别、自然语言处理的智能语音聊天机器人。

2025-03-16 00:38:56 527

原创 红外场景下行人重识别【附代码,可做跨视频人员检测】

本项目实现了基于红外场景下的行人重识别,主要利用了算法和技术。相较于可见光场景,红外场景具有不受光照影响、可穿透烟雾等优势,在安防监控、智能交通等领域具有广泛应用前景。然而,红外图像分辨率低、细节信息缺失等特点也为行人重识别带来了巨大挑战。本项目针对红外场景特点,对YOLO和ReID算法进行了改进和优化,有效提升了红外场景下行人重识别的准确率和鲁棒性。

2025-03-14 22:06:37 606

原创 DeepSeek + 知识库:定制你的专属“AI专家”,快速解决专业问题!小白也能秒变“知识达人”!

你是否遇到过这些问题?面对海量的专业资料,找不到重点,头大如斗?需要快速解决某个领域的问题,却不知道从哪里开始?企业内部流程繁琐,员工总是反复问同样的问题?想搞科研,但学科交叉太难,找不到合适的切入点和资源?

2025-03-11 19:49:22 837

原创 stable diffusion Webui部署记录

(关于环境的安装:先删除req.txt文件中的torch,然后用pip镜像安装,这些依赖安装完毕后,再安装离线的torch,然后再双击webui-user.bat)将需要的权重放在models下面。

2025-03-08 01:33:00 284

原创 基于深度学习的绘画风格迁移系统(附代码)

在人工智能的推动下,艺术创作正迎来前所未有的变革。风格迁移(Style Transfer)作为计算机视觉领域的一项经典技术,使我们能够在保留原始图像内容的同时,赋予其另一幅画作的独特艺术风格。无论是梵高的《星空》、莫奈的《睡莲》,还是毕加索的立体主义作品,风格迁移都能让普通照片焕发艺术光彩,化身为风格独特的艺术作品。在这篇博客中,我们实现了一个 风格迁移 Demo,旨在为初学者和毕业设计提供一个易于上手的学习案例,并附上代码,方便大家理解和实践。

2025-03-03 18:34:08 352

原创 DeepSeek与llama本地部署(含WebUI)

DeepSeek从2025年1月起开始火爆,成为全球最炙手可热的大模型,各大媒体争相报道。我们可以和文心一言一样去官网进行DeepSeek的使用,那如果有读者希望将大模型部署在本地应该怎么做呢?本篇文章将会教你如何在本地傻瓜式的部署我们的deepseek,即便你是文科生也可以做到,不会涉及代码编程,只需要一些命令。我笔记本:2019款拯救者,windows 10;内存8G,CPU:intel 9th i5;GPU:NVIDIA 1650 4G,256G固态+1T机械硬盘。LLama3.2大。

2025-02-05 14:43:29 3385

原创 校园安防系统(用于实现跟踪特定的陌生人并语音报警、跨视频检测、生成人员轨迹路线)

校园安全已成为社会各界关注的焦点。然而,随着校园开放性的增强和人员流动性的加大,如何有效防范陌生人的非法入侵,确保师生安全,成为了一个亟待解决的难题。今天,本文推出一种创新的校园安防系统,它不仅能够实现特定陌生人的智能跟踪与即时语音报警,还能跨越多个视频监控区域进行无缝检测,并最终生成详尽的人员轨迹路线,为校园安全筑起一道坚实的防线。1.特定人员跟踪:根据待搜索人员已有的照片,在监控视频中进行检索并跟踪,实现特定人员的跟踪并进行语音报警,可支撑跨镜头检测,人员被遮挡后再出现也能及时锁定。

2025-01-21 16:25:02 278

原创 利用OnnxRuntime进行torch模型部署(C++版)——以分类网络为例

近年来,ONNX(Open Neural Network Exchange)格式的兴起为解决这一问题提供了有效的途径。ONNX是一种开放标准,旨在使不同深度学习框架之间能够共享模型。通过将模型导出为ONNX格式,我们可以轻松地在不同框架和平台上进行部署和推理。而ONNX Runtime,作为微软开源的高性能推理引擎,更是为模型的部署提供了强大的支持。本文将重点介绍如何利用ONNX Runtime在C++环境中部署PyTorch模型。,而。通过结合这两者的优势,我们可以实现深度学习模型的高效部署和推理。

2024-12-22 13:03:38 1797 1

原创 AIGC-Stable Diffusion进阶2-CLIP

CLIP 是一种强大的多模态模型,能够在统一的潜在空间中高效对齐和对比文本与图像。这使得它在跨模态任务中表现卓越,尤其是在需要泛化能力的场景下,如零样本学习和跨模态检索。

2024-12-13 00:51:02 1057

原创 plt.hist和np.histogram在绘制直方图的时的不同

数据分析和可视化的世界里,直方图是一种非常直观且有效的工具,能够帮助我们了解数据的分布情况。无论是统计学中的频率分布,还是机器学习中的特征分析,直方图都扮演着不可或缺的角色。plt.hist和。尽管它们的目标相似,但在具体使用和功能细节上却存在着显著的差异。本文将深入探讨这两个方法的不同之处,帮助读者在数据分析和可视化过程中做出更加明智的选择。首先,plt.hist是Matplotlib库中的一个函数,它不仅能够,还能。只需一行代码就能快速生成一个包含数据分布信息的图表。

2024-11-25 00:14:31 943

原创 利用透视变换实现文档矫正功能

透视变换是将成像投影到一个新的平面上,也称作投影映射。OpenCV通过函数cv2.getPerspectiveTransorm(pos1,pos2)构造矩阵M,其中pos1和pos2分别表示变换前后4个点的对应位置。得到M后再通过函数cv2.warpPerspective(src,M,(cols,rows))进行透视变换。

2024-10-21 20:13:10 324

原创 基于深度学习的人脸多任务识别(附代码)

本项目为人脸多任务识别(单输入,多输出),可以同时输出人脸关键点、性别和年龄。采用了两个算法进行应用的实现,人脸目标检测和人脸多任务识别。其中人脸目标检测采用YOLOV5进行实现,主要对人脸部分进行截取,再送入多任务网络进一步处理

2024-07-06 14:59:07 981 2

原创 基于YOLOv5的人脸目标检测

本文是在之前的基于yolov5的人脸关键点检测项目上扩展来的。因为人脸目标检测的效果将直接影响到人脸关键点检测的效果,因此本文主要讲解利用yolov5训练人脸目标检测(关键点检测可以看我人脸关键点检测文章)

2024-07-03 14:25:39 2451 4

原创 基于YOLOv5的人脸关键点检测(附代码)

本项目的实现主要依靠两个算法:yolov5目标检测和resnet人脸关键点算法。其中目标检测算法为人脸关键点检测算法的前置算法,使用目标检测算法将人脸信息进行提取(起到前景与背景的分离),然后再对box内的人脸信息进行关键点检测。本项目支持功能:人脸关键点的训练:√人脸关键点的视频检测:√注:本项目为人脸关键点检测,没有在本项目中。

2024-07-03 13:32:58 2011

原创 Reid系列论文学习——无人机场景下基于 Transformer 的轻量化行人重识别

今天介绍的一篇论文是针对无人机场景下的行人重识别,论文题目为:"无人机场景下基于 Transformer 的轻量化行人重识别"。该论文针对无人机场景下行人呈现多角度多尺度的特点、以及传统CNN网络在行人重识别任务中受限于感受野和下采样导致的无法充分提取特征,同时也为了便于算法的部署而提出了一种基于Transformer轻量化Reid网络(Lightweight Transformer-based Person Re-Identification, LTReID)。本人这里并不负责复现。

2024-06-29 12:21:03 1534

原创 Yolov8训练自己的数据集(脱离ultralytics库)

最近在整理关于yolov8的相关内容,有个很大的问题,抛开yolov8性能不谈,yolov8代码的使用灵活性不如yolov5,尤其是对于一些新手或者对yolo框架不是很熟悉的人(这也是因人而异,有些人可能会喜欢v8代码的使用方式)。比如在使用v8的时候需要安装ultralytics库,然后再调用YOLO进行训练或者预测,那么就有这几个问题:问题1:安装了ultralytics库后如何使用YOLO呢?问题2:如果希望像v5一样修改网络或者修改其他代码怎么办?这篇文章就是让你可以像c5一样使用v8代码

2024-05-26 14:54:01 1804

原创 YOLOV8训练自己的数据集教程

YOLOV8是一种先进的目标检测算法,能够在图像和视频中快速准确地识别多个对象。随着计算机视觉和深度学习技术的不断发展,YOLOV8已成为许多领域中的重要工具,包括智能监控、自动驾驶、工业检测等。然而,由于不同应用场景的差异,,因此对于提高检测精度和适应特定场景至关重要。本教程将向各位介绍,以便更好地满足个性化的目标检测需求。,本文章包含了YOLOV8网络结构图的详解。

2024-05-21 11:01:46 2471

原创 YOLOv8原理详解

Yolov8是2023年1月份开源的。与yolov5一样,支持目标检测、分类、分割任务。Yolov8依旧采用的CSP的思想,不过将Yolov5中的C3模块替换为C2F模块,进一步降低了参数量,同时yolov8依旧采用了yolov5中的SPPF模块;Yolov8依旧采用了PAN思想,只不过是将PAN中的上采样阶段中的卷积结构删除,将C3模块替换为了C2F模块;该方法是采用了YOLOX的head部分,分类和回归两个任务的head不再共享参数;YOLOv8使用了Anchor-Free的思想;YOLOv8使用。

2024-05-19 12:05:03 7350

原创 eclipse安装与使用说明

本文章主要记录安装和使用eclipse所遇到的问题。因授课需求,需要安装旧版本的eclipse安装包,特此记录。安装的eclipse为eclipse-java-luna-SR1-win32-x86_64。下载。

2024-05-16 18:35:45 1580

原创 AIGC-Stable Diffusion进阶1(附代码)

在上篇文章中对Stable Diffusion进行了初步的认识,也给出了使用案例,这篇文章将进一步的去刨析一下SD模型。

2024-05-14 11:43:23 1272

原创 YOLOv5手势物体识别(附代码)

之前是做的yolov3手势物体识别,最近几天我将该项目进行了重新的整理和升级,实现了yolov5手势物体识别,同时为了方便更多的人直接拿来应用,我生成了支持windows系统的应用小程序,即便你电脑上没有安装pytorch,没有安装cuda、python,都可以使用~!

2024-05-04 02:43:51 2867 9

原创 YOLOv8 Reid(附代码,行人重识别)

该项目利用yolov8+reid实现的行人重识别功能。应用场景:可根据行人的穿着、体貌等特征在视频中进行检索,可以把这个人在各个不同摄像头出现时检测出来。可应用于犯罪嫌疑人检索、寻找走失儿童等。支持功能:1.训练2.人员标注3.Reid(行人重识别)环境说明:(项目中有requirements.txt)mss==7.0.1。

2024-04-20 15:35:38 4419 1

原创 分类网络(支持特征可视化)附代码

这几天我们对分类网络项目进行了更新,现在已经可以提供给有需求的人使用了。如果您对此感兴趣,请随时自取。1.支持训练自己的数据集2.tensorboard训练可视化3.增加ROC评价指标4.支持ResNet网络、MobileNet、Alexnet、vgg16、Vit5.支持特征可视化6.支持冻结训练1.剪枝训练2.知识蒸馏训练3.利用目标检测和分类做接打电话和吸烟行为检测。

2024-04-19 01:33:15 1249

原创 Yolov7 Reid【附代码,行人重识别,可做跨视频人员检测】

本项目使用Yolov7+Reid实现的行人重识别功能,可做跨视频人员检测。应用场景:可根据行人的穿着、体貌等特征的Reid算法在视频中进行检索,可以把这个人在各个不同摄像头出现时检测出来。可应用于犯罪嫌疑人检索、寻找走失儿童等。支持GUI界面。支持功能:1.训练2.人员标注3.人员查找(可做。

2024-03-31 14:46:11 3281 2

原创 Qt开发(2)——在已有VS项目中配置Qt

在之前的Qt开发学习中,基本都是在Qt Creator中创建一个Qt项目,或者即便是在VS中也是直接新建一个Qt项目。但很少有记录如何在已有的C++项目中添加Qt,这就好比我有个项目已经开发完了,现在又说加个Qt界面的功能。这篇文章就是记录如何在已有项目上配置Qt。

2024-03-24 21:57:45 7161 4

原创 Qt开发(保姆级)附代码

Qt基础保姆级学习笔记

2024-03-19 22:36:46 1091

原创 基于yolov5的数据集自动标注功能脚本工具【附代码】

近年来,随着深度学习的迅猛发展,计算机视觉领域取得了巨大的突破。其中,目标检测是计算机视觉中的一个重要任务,它在许多应用领域中起到了至关重要的作用。然而,目标检测所需的大量标注数据集的制作却是一项耗时且繁琐的工作。为了解决这个问题,本文实现了一个基于YOLOv5的自动数据集标注功能脚本。YOLOv5是当今目标检测领域的一种优秀模型,其高效准确的检测能力被广泛认可。我们的自动数据集标注工具通过使用已经训练好的YOLOv5模型,可以快速而准确地对输入的图像进行目标检测,将检测结果存储为标签文件(xml格

2024-01-28 16:06:12 3692 9

原创 PyQt---基本界面设计【附代码】

Qt是GUI开发中的一个工具,可以根据用户需求进行程序界面的开发。Qt的开发有C++版的和python版的,不论你有哪种编程语言的基础都很好上手学习。PyQt5是Qt框架的Python语言实现,也是本文将要介绍的,并将会建立一个PyQt专栏不断更新供大家学习。

2023-12-11 15:48:31 8216 1

原创 AIGC-Stable Diffusion

Stable Diffusion(稳定扩散)是一种生成式大模型,它在AI领域中标志着一个新的里程碑,为我们揭示了未来将会是AIGC的时代。传统的深度学习模型逐渐向AIGC过渡,这也意味着我们需要学习更多关于AIGC的内容。如果你和我一样是AIGC的,那么学习AIGC模型的基础知识是非常重要的。Stable Diffusion作为一个强大的模型,有着很高的适用性,特别是在生成式任务方面。通过学习它的基本理论和应用,可以更好地理解复杂网络中的信息传播规律,并掌握不同场景下的生成技术。

2023-12-07 14:07:01 1418 1

原创 AIGC-从代码角度去理解DDPM(扩散模型)

最近准备要学习一下AIGC,因此需要从一些基本网络开始了解,比如DDPM,本篇文章会从来供大家学习了解。DDPM(Denoising Diffusion Probabilistic Models) 是一种扩散模型。和。对应到上述图中,从x0到xt是加噪的过程,从xt到x0是去噪的过程。前向加噪过程和反向去噪过程都是,全过程大约需要步。是对输入数据不断的加噪声(高斯噪声)。是对从标准高斯分布中逐步地得到一个个噪声样本,最终得到生成的样本的数据。

2023-12-02 11:35:14 1460 2

原创 yolov5+车辆重识别【附代码】

本篇文章主要是实现的yolov5和reid结合的车辆重识别项目。是在我之前实现的yolov5_reid行人重识别的代码上修改实现的baseline模型。

2023-10-15 13:23:40 4028 16

原创 有关数据集处理的脚本工具【附代码】

在做分类项目的时候(包括目标检测),经常会涉及到数据集的预处理,这里我将把一些自己写的工具脚本代码开源出来供大家使用,后期也将不定时的更新。相关功能:1.分类任务one-hot标签转单标签2.数据集中各个类别的统计3.数据集中图片宽、高分布,宽高比分布4.针对数据集中极端宽高比的图片进行可视化。

2023-10-12 18:37:43 488

原创 分类网络的评价指标

在分类网络中常用到的评价指标其实有很多,比如准确率(Acc)、错误率(ErroRate)、精确率(Precision)、召回率(Recall)、F1、ROC等等。

2023-10-11 21:32:53 793

原创 基于yolov5的onnx精度测试[附代码]

我们在训练好自己的yolov5模型后,需要对模型进行部署,大多是将torch转为onnx格式进行使用.但在部署之前需要对转的onnx模型进行精度上的测试,,如果不一致或差距较大还需要进一步的调整.将会在你的项目中生成对应的onnx模型.可以通过Netron对onnx模型进行可视化.如果你不想下载Netron,可以访问网页版的我这里将提供三种方式来测试转化后的onnx精度.

2023-10-08 17:08:56 1881

原创 基于yolov5的ignore classes训练

我们在标注数据集的时候都是标注的正样本,训练过程中也是这样训练,让网络对正样本计算loss。但我们也遇到过这样的目标,这个目标即不属于正样本,也不属于负样本,比如正样本是person,那么人形雕塑或者人的影子,这类物体他并不是正样本,但如果直接归为负样本也是不严谨的,因此就可以将这类物体标注为“忽略类”

2023-09-27 16:47:26 1116 5

原创 Vision Transformer(vit)原理分析以及特征可视化

Vision Transformer(ViT)是一种基于架构的深度学习模型,用于图像识别和计算机视觉任务。与传统的卷积神经网络(CNN)不同,ViT直接,并利用自注意力机制来处理图像中的像素关系。ViT通过将图像分成一系列的,并。然后,这些向量将通过多层的Transformer编码器进行处理,其中包含了。这样可以。最后,通过对Transformer编码器输出进行分类或回归,可以完成特定的视觉任务。为什么不能直接将transformer直接应用于图像处理中呢?

2023-08-29 17:42:29 24761 27

原创 YOLOv5 tensorRT C++代码详解之engine的读取

engine文件的读取需要用到ifstreamifstream – 从已有的文件读入ofstream – 向文件写内容fstream - 打开文件供读写文件打开模式:ios::in 只读ios::out 只写ios::app 从文件末尾开始写,防止丢失文件中原来就有的内容ios::binary 二进制模式ios::nocreate 打开一个文件时,如果文件不存在,不创建文件ios::noreplace 打开一个文件时,如果文件不存在,创建该文件。

2023-08-20 12:41:05 1984 2

原创 Transformer理论学习

Transformer出自于论文《attention is all you need》。一些主流的序列模型主要依赖于复杂的循环结构或者CNN,这里面包含了编解码器等。而Transformer主要的结构是,而且是用多头注意力机制去替换网络中的循环或者CNN(换言之就是这个网络模型是不需要循环结构和CNN,只用注意力机制就行一些循环神经网络,比如LSTM,GRU等都是由编码器-解码器构成。以RNN为例,在计算序列的时候(比如一个句子),会一个词一个词的计算,对于第个词,会计算一个隐藏状态叫。

2023-08-09 00:11:16 1113

原创 自制聊天机器人实现与chatgpt或微信好友对话【附代码】

闲来无事,想实现一个可与或者对话的聊天机器人。该聊天机器人还可应用于QQ好友或者其他地方的语音输入。功能还是比较简单的,后期会慢慢更新,让人机交互体验感不断提升。项目描述:语音输入(等待时间为2秒,可自行调整),再将输入到对话框中(识别时长为5秒,可自行调整),语音输入"关闭语音助手"将提出程序。利用语音识别完成文字输入,实现聊天功能。

2023-06-29 18:27:06 1140

原创 基于SSD算法的电动车头盔检测【附代码】

本项目是基于SSD算法实现的电动车头盔检测。完整的项目是基于SSD的改进-->知识蒸馏-->自蒸馏-->剪枝-->trt推理。本想用来发论文的,但可能没那时间和精力了,这里仅选择项目中的一部分内容进行开源。

2023-06-19 16:25:32 2243

深度学习+目标检测+训练自己数据集+YOLOX+剪枝+轻量化

采用pytorch深度学习环境,目标检测为YOLOX,可做剪枝。 功能描述: 1.可训练自己数据集 2.支持图像推理 3.支持视频推理 4.支持mAP测试 5.支持任意层的剪枝 6.支持多种模型 7.支持微调训练 内含readme文件,可快速上手。代码成熟,已有多人测试适用 适用人群:研究人员,研究生,大学生,深度学习研究人员。

2023-03-09

深度学习+目标检测+训练自己的数据集+tensorrt推理+语音报警+目标跟踪与计数

采用pytorch环境,目标检测算法采用yolov4,支持onnx推理,tensorrt推理,涵盖训练与推理教程以及相关博文链接。 功能描述: 1.支持目标检测 2.支持torch格式推理 3.支持onnx推理 4.支持tensorrt推理 5.支持指定类别的检测 6.支持指定类别语音报警 7.支持指定类别的目标跟踪 8.多进程任务 目标跟踪支持IOU、DIOU。可做CIOU跟踪,可训练自己的数据集,内含readme说明,详细说明代码如何使用。 适用人群:计算机视觉学习人员,研究生,大学生

2023-03-09

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除