自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

实力派,无需多言!

【专注】深度学习、计算机视觉、自然语言处理、OpenCV方向研究,不限于目标识别检测、跟踪、图像分类、分割、场景理解、姿态估计、动作识别、视频分析、三维重建、迁移学习、强化学习、算法改进优化等。毕设、课设、比赛指导,公司实际项目开发!欢迎交流,相互学习!

  • 博客(446)
  • 资源 (569)
  • 收藏
  • 关注

原创 【人工智能毕设课设】基于YOLOv9实现的线下课堂学生上课状态识别检测系统(附项目源码和数据集下载)

在现代教育环境中,教师对于学生在课堂上的状态监控需求日益增加。传统的监控方式往往依赖于人工观察,不仅效率低下,而且难以做到全面覆盖。为了解决这个问题,我们基于YOLOv9(You Only Look Once version 9)开发了一个线下课堂学生上课状态识别检测系统。该系统能够自动识别学生的上课状态,包括注意力集中、打瞌睡、玩手机等行为,从而帮助教师更好地管理课堂。本文将详细介绍该系统的Python源码、运行教程、训练好的模型以及评估指标曲线,以便读者能够快速上手并应用于实际场景中。

2024-10-14 16:27:21 2079 6

原创 基于YOLOv8+PyQt5开发的行人过马路危险行为检测告警系统(附数据集和源码下载)

交通安全一直是一个备受关注的重要议题。每年都有大量的交通事故发生,其中很多都与行人在过马路时的危险行为有关。故我开发了一种基于YOLOv8的行人过马路危险行为检测告警系统。它能够快速准确地识别图像或视频中的行人,并判断他们是否存在危险行为。通过结合计算机视觉和深度学习技术,该系统能够实时监测行人在过马路时的行为,并及时发出警报,以提醒行人和驾驶员注意交通安全。提示:以下是本篇文章正文内容在本博客中,我们介绍了基于YOLOv8和PyQt5的行人过马路危险行为检测告警系统。

2023-08-13 10:00:00 5570 5

原创 使用Resnet网络对人脸图像分类识别出男女性别(包含数据集制作+训练+测试)

这两天有点忙,本打算昨天准备写这篇博客内容的,推迟到今天晚上。实际上,上午我已经把模型训练完了,准确率可以达到95%,考虑到用的台式机没有装显卡,所以使用的数据集一共只有340张。分布情况如下。【训练集】女性:150张;男性:150张【验证集】女性:20张;男性:20张数据集预览女性数据男性数据提示:以下是本篇文章正文内容,下面案例可供参考实际上很多可以修改,如loss选择、梯度下降方法、学习率、衰减率等等。

2022-11-19 23:27:31 8598 18

原创 基于RNN循环神经网络、LSTM、GRU和改进GRU空中目标意图识别实现(附源码+数据集+程序说明)

目标战术意图由一系列动作实现,因此目标状态呈现时序动态变化特征。针对目标意图识别问题的特点,本文是对基于循环神经网络进行意图识别的实现。现有的用于复杂环境下对目标意图识别方法主要有模板匹配、证据推理、贝叶斯网络和神经网络等。提示:以下是本篇文章正文内容,下面案例可供参考。

2022-11-10 23:29:27 3769 36

原创 100种目标检测数据集【voc格式yolo格式json格式coco格式】+YOLO系列算法源码及训练好的模型

本文介绍并分享了应用于各行业、各领域非常有用的目标检测数据集(感谢您的关注+三连,数据集持续更新中…),其中绝大部分数据集作者已应用于各种实际落地项目,数据集整体质量好,标注精确,数据的多样性充分,训练模型拟合较好,具有较高的研究和使用价值,各数据集都有下载链接及作者训练好的模型+源码下载链接,同时也有对应的检测效果视频,请放心下载~【实际项目应用】:阳光厨房、明厨亮灶智能监控方案【数据集说明】:老鼠检测数据集已更新到2018张,图片包含有白天和黑夜老鼠出没照片,标签包含voc(xml)和yolo格式

2022-10-12 21:32:27 25819 33

原创 【深度学习笔记】五步教你使用Pytorch搭建神经网络并训练

文章目录前言一、准备数据&加载数据1.准备数据(分类)2.加载数据二、定义损失函数1自定义损失函数或者使用Pytorch中现有的三、定义网络四、定义优化器五、迭代训练总结前言针对刚接触深度学习的小伙伴,肯定很想自己亲手搭建一个网络模型,训练模型。今天作者就五步教大家简单快速搭建一个分类网络,并训练模型,希望对初学者有一定帮助,欢迎大家收藏关注,作者将不断分享更新深度学习中的一些重要知识点。一、准备数据&加载数据1.准备数据(分类)作者是训练分类训练工作服和非工作服,如下图所示.

2021-09-03 10:05:37 10186

原创 一文弄懂--人工智能中的Transformer是什么?

Transformer是一种革命性的神经网络架构,主要用于处理序列数据,如自然语言处理(NLP)任务。它通过自注意力机制同时处理整个序列,显著提高了处理长距离依赖关系的能力。与传统的循环神经网络(RNN)和卷积神经网络(CNN)相比,Transformer具有更高的并行性和效率,使其在机器翻译、文本生成、语音识别等领域表现出色。Transformer的核心组件包括输入嵌入、位置编码、多头自注意力机制和前馈神经网络。其成功推动了大规模语言模型(如GPT和BERT)的发展,并在多模态AI系统中展现出巨大潜力。T

2025-05-14 16:48:02 1553

原创 【智慧养猪场】-猪的行为分析视频数据集及展示(已做好分类)

通过对这些视频数据的分析,能够应用视频识别技术对猪的日常行为进行监控和分析,进而实现自动化管理养猪场,提高养殖效率和动物福利。在技术应用方面,涉及到视频处理技术、计算机视觉、行为识别算法、人工智能与机器学习、物联网技术等多种IT领域的知识点。例如,利用计算机视觉技术结合图像处理和机器学习算法,对视频帧序列进行分析,来检测和分类特定的行为;运用行为识别算法,如深度学习中的卷积神经网络(CNN)和递归神经网络(RNN),通过训练模型来识别和分类不同的行为。

2025-04-09 10:39:23 1246 2

原创 【毕设课设系列】基于深度学习实现多位手写数字识别系统准确率达99.3%(附源码+数据集+识别效果展示+运行教程)

我们的目标是构建一个系统,能够识别包含多个手写数字的图像(例如,图像中可能包含两个或更多的手写数字)。数据准备:获取并预处理包含多位手写数字的数据集。模型构建:使用深度学习框架(如TensorFlow或PyTorch)构建卷积神经网络模型。模型训练:训练模型以识别手写数字。模型评估:评估模型的性能。模型应用:使用训练好的模型进行预测。

2025-03-14 16:13:00 1093 5

原创 Python初学者常犯的错误及其解决办法

在Windows里面你直接打开CMD、Powershell或者在macOS、Linux上打开终端,你看到的黑色窗口叫做命令行,这里执行的是命令。macOS、Linux的命令行一般是以符号开头。当你在终端里面,输入python3并回车的时候,打开的是Python交互环境>>>Python交互环境里面执行的是Python代码,而不是shell命令。你需要搞清楚,你是要执行shell命令、CMD命令还是执行Python代码。执行shell命令,就在终端里面,执行CMD命令,就在CMD里面。

2024-11-28 16:28:52 1119

原创 基于STM32F407ZGT6芯片+多传感器开发的多参数水质监测系统含论文+答辩PPT+软硬件资料

STM32F407ZGT6微控制器:作为系统的核心处理器,负责数据采集、处理及通信逻辑的实现。该芯片具有高性能、低功耗的特点,适用于嵌入式控制系统。水质传感器温度传感器:用于监测水体的温度。pH值传感器:用于监测水体的酸碱度。溶解氧传感器:用于监测水体中的溶解氧含量。电导率传感器:用于监测水体的电导率。无线通信模块:通过Wi-Fi或LoRa等无线通信技术,实现数据的远程传输。本项目选用ESP8266 Wi-Fi模块。电源模块:为整个系统提供稳定的电源。

2024-11-25 08:30:00 1859

原创 C语言基于AVR单片机的电子万年历设计-附项目源码+论文

AVR单片机:作为系统的核心处理器,负责数据处理和控制逻辑的实现。本项目选用ATmega328P单片机。RTC模块:用于提供精确的时间基准。本项目选用DS3231实时时钟模块。LCD显示模块:用于显示时间、日期和星期等信息。本项目选用1602字符型LCD显示屏。按键模块:用于设置时间和日期。本项目使用4个按键,分别用于增加、减少、确认和返回操作。电源模块:为整个系统提供稳定的电源。

2024-11-24 12:00:00 898

原创 基于STM32的智能温室大棚控制系统设计(含软硬件及全部资料+说明文档)

STM32微控制器:作为系统的核心处理器,负责数据采集、处理及控制逻辑的实现。温度传感器:用于监测温室内的温度。湿度传感器:用于监测温室内的湿度。光照强度传感器:用于监测温室内的光照强度。土壤湿度传感器:用于监测土壤的湿度。继电器模块:用于控制风扇、水泵、补光灯等设备的开关。通信模块:通过Wi-Fi或LoRa等无线通信技术,实现远程监控和数据传输。LCD显示模块:用于显示当前的环境参数和系统状态。

2024-11-24 10:00:00 2530

原创 数学建模竞赛:生产企业原材料的订购与运输:解决生产企业原材料的订购与运输问题

( x_{ij} ):从供应商 ( i ) 订购并运输到工厂 ( j ) 的原材料数量。( c_{ij} ):从供应商 ( i ) 运输到工厂 ( j ) 的单位成本。( p_i ):供应商 ( i ) 的供货价格。( d_j ):工厂 ( j ) 的需求量。( s_i ):供应商 ( i ) 的供货能力。

2024-11-23 13:45:00 1288

原创 课程设计:基于FPGA的出租车计价系统

FPGA控制模块:选用Xilinx或Altera系列的FPGA芯片,利用VHDL/Verilog语言编写控制逻辑。传感器模块:采用霍尔效应传感器检测车轮转动次数,进而计算行驶距离。显示模块:使用7段数码管或LCD屏显示相关信息。按键模块:包含启动、停止等几个按键,用于控制计价过程。电源模块:为系统提供5V或3.3V直流电。

2024-11-23 12:30:00 1831

原创 基于51单片机的嵌入式油烟机控制系统设计含源码+原理图+说明文档

51单片机:作为系统的核心处理器,负责接收来自各传感器的数据,并根据预设算法控制风扇的转速。烟雾传感器:用于检测厨房内油烟浓度的变化,为系统提供实时数据支持。温度传感器:监测厨房温度,辅助判断油烟产生情况。风扇驱动模块:接收单片机发出的指令,调整风扇转速以适应不同的油烟浓度。按键模块:允许用户手动设置工作模式或调整参数。LCD显示模块:用于显示当前的工作状态、油烟浓度等信息。

2024-11-22 09:30:00 801

原创 基于STC89C52单片机的简易温度测量系统+设计报告(含温度测量、时间显示、时间修改、数据记录和数据回显等功能)

🚀完整项目源码下载链接👉。

2024-11-21 09:00:00 750

原创 基于STM32F407VET6单片机的自动泊车系统设计--含设计报告和文档资料

在相邻车库有车的情况下完成倒车入库和侧方位入库。在相邻车库无车的情况下完成倒车入库和侧方位入库。能够连续完成上述功能组合。

2024-11-20 10:45:00 1289

原创 基于单片机矿工生理状态监测系统的设计与实现-含源码+论文

本文通过查阅国内外相关资料,设计并实现了一套基于单片机的矿工生理状态监测系统。该系统能够实时监测矿工的体温、心率、血氧值和物理角度,并通过WiFi模块将数据传输到云平台,有效提高了矿工的工作安全性和健康水平。硬件优化:提高传感器的灵敏度和准确性,增强数据采集和传输的稳定性和可靠性。软件优化:开发更加高效、准确和实用的算法,提高数据处理和分析的精度和效率。应用拓展:探索生理状态监测系统的应用领域和未来发展方向,将其技术应用到其他行业和领域中,为人们的生产生活提供更加安全、健康和高效的保障。

2024-11-20 08:00:00 2108

原创 基于MATLAB的超宽带(UWB)信号的仿真和测试系统

随着无线通信技术的发展,超宽带(Ultra-Wideband, UWB)技术因其高数据传输速率、低功耗、抗多径衰落等优点而受到广泛关注。UWB技术适用于短距离高速数据传输,如个人区域网络、雷达系统和精确位置定位等应用。本文将介绍如何使用MATLAB进行UWB信号的仿真与测试,并构建一个完整的测试系统。🚀完整项目源码下载链接👉。

2024-11-19 15:35:45 1786

原创 基于ROS的GNSS定位系统:使用因子图优化(FGO)和扩展卡尔曼滤波(EKF)进行GNSS数据融合

因子图优化是一种基于图论的优化方法,通过构建因子图模型,将观测数据和先验知识转化为图中的节点和边,然后通过优化算法求解最可能的状态。因子图优化在处理非线性问题和多模态数据方面具有优势。

2024-11-19 15:30:35 2292

原创 模拟低轨道卫星通信:基于Python计算卫星与地面站之间的可见性和通信延迟

轨道高度:卫星距离地球表面的高度。倾角:卫星轨道平面与赤道平面的夹角。周期:卫星绕地球一周所需的时间。

2024-11-19 15:22:35 2056

原创 使用深度强化学习方法实现股票投资组合优化(附项目源码+数据集+论文报告+答辩PPT)

本项目使用了科技公司的股票数据,包括但不限于苹果(AAPL)、谷歌(GOOGL)、微软(MSFT)等。数据来源包括历史股价、成交量、财务指标等。数据预处理步骤包括清洗、归一化和特征工程。

2024-11-16 08:45:00 1846

原创 采用多种深度学习、机器学习算法实现目标意图识别系统——含完整项目源码

描述:航空旅行信息系统的英文数据集。训练数据:4978条测试数据:888条类别:22个支持向量机是一种监督学习模型,用于分类和回归分析。它通过找到一个超平面来最大化不同类别之间的间隔。

2024-11-15 18:15:29 1280

原创 深度强化学习方法--三维路径规划算法设计与实现(RRT+AOC+APF)

A*算法是一种启发式搜索算法,通过估计从当前节点到目标节点的成本来指导搜索方向。它结合了Dijkstra算法的广度优先搜索和贪婪最佳优先搜索的特点。本文介绍了如何在Matlab中实现基于深度强化学习的三维路径规划算法,并结合了多种传统路径规划算法。

2024-11-15 18:00:12 2056

原创 Flask和Python实现在线课堂学生疲劳检测系统设计与实现

后端:Flask(Web框架)前端图像处理:OpenCV(计算机视觉库)GUI界面:Tkinter(Python标准GUI库)本文介绍了如何利用Flask、OpenCV和Python开发一个在线课堂学生疲劳检测系统。通过视频流捕获、面部检测、疲劳检测和结果展示,我们展示了整个系统的搭建过程。

2024-11-15 17:48:26 1264

原创 基于机器学习电信号EMG训练分类模型控制仿生手控制系统(Matlab-Simulink实现)

肌电图(EMG)信号是从肌肉活动中获取的电信号,这些信号可以通过放置在皮肤表面的电极进行采集。EMG信号反映了肌肉活动的状态,是控制仿生手的重要输入。本文介绍了如何利用机器学习方法和Matlab-Simulink实现基于EMG信号的仿生手控制系统。通过数据采集、预处理、特征提取、分类模型训练和控制系统实现,我们展示了整个系统的搭建过程。

2024-11-15 17:39:43 1657

原创 基于YOLOv9的空中飞鸟识别检测系统(附项目源码和数据集下载)

基于YOLOv9的空中飞鸟识别检测系统是一个利用深度学习技术进行鸟类识别的应用,旨在实现对机场等场景中飞鸟的实时检测和预警,从而帮助提升飞行安全。本文将详细介绍该系统的Python源码、运行教程、训练好的模型以及评估指标曲线。

2024-10-15 12:00:00 2020

原创 基于YOLOv9实现的自行车检测系统:为共享自行车违停项目开发(附项目源码及数据集下载)

随着城市化进程的加快,自行车作为绿色出行工具,其数量在不断增加。然而,随之而来的自行车违停问题也日益严重,给城市交通管理带来了挑战。为了有效监测自行车违停情况,我们基于YOLOv9(You Only Look Once version 9)开发了一款自行车检测系统。该系统能够实时检测视频或图像中的自行车,并识别其是否违停,为城市交通管理提供智能化解决方案。本文将详细介绍该系统的Python源码、运行教程、训练好的模型以及评估指标曲线,旨在帮助读者快速上手并将其应用于自行车违停项目的开发中。

2024-10-14 16:55:43 2022

原创 【人工智能毕设课设】基于YOLOv9的水果(香蕉)成熟度识别划分系统(附项目源码和数据集下载)

YOLOv9是YOLO系列算法的最新版本,它在保持高效推理速度的同时,进一步提升了检测精度。通过引入更先进的网络结构、优化训练策略以及增强数据增强技术,YOLOv9在多个目标检测基准测试中取得了优异表现。本项目成功开发了一个基于YOLOv9的香蕉成熟度识别系统,实现了从数据预处理、模型训练到测试评估的完整流程。通过实际测试,系统表现出较高的识别精度和鲁棒性,为香蕉生产和管理提供了有力的技术支持。

2024-10-14 16:02:10 1543

原创 面试智力题 (附答案)

"Mr Miller为记 者举例说明了一种比较合理的答法,他首先在纸上画出了CN TOWER的草图,然后快 速估算支架和各柱的高度,以及球的半径,算出各部分体积,然后和各部分密度运 算,最后相加得出一个结果。如果有两顶黑帽子,第一次两人都只 看到对方头上的黑帽子,不敢确定自己的颜色,但到第二次关灯,这两人应该明白 ,如果自己戴着白帽,那对方早在上一次就应打耳光了,因此自己戴的也是黑帽子 ,于是也会有耳光声响起;现在小明过桥要1秒, 小明的弟弟要3秒,小明的爸爸要6秒,小明的妈妈要8秒,小明的爷爷要12秒。

2024-06-25 13:15:00 858

原创 嵌入式系统习题库及答案

嵌入式系统习题库及答案## 1.选择题1. 以下哪个不是嵌入式系统的设计的三个阶段之一:(A)A 分析B 设计C 实现D 测试2. 以下哪个不是RISC架构的ARM微处理器的一般特点:(C)A 体积小、低功耗B 大量使用寄存器C采用可变长度的指令格式,灵活高效D 寻址方式灵活简3. 通常所讲的交叉编译就是在X86架构的宿主机上生成适用于ARM架构的( A )格式的可执行代码。

2024-06-25 09:45:00 1744

原创 面试问题总结(包含各方面)

2、说出自己的观点:“我符合贵公司的招聘条件,凭我目前掌握的知识、技能、 高度的责任感、 良好的适应能力及学习能力, 完全能胜任这份工作。2、说出自己对困难所持有的态度:“工作中出现一些困难是正常的, 也是难免的, 但是只要有坚忍不拔的毅力、勤奋的学习态度, 良好的合作精神以及事前周密而充分的准备, 任何困难都是可以克服的。我的目的是:了解应聘者的心理承受能力、逻辑思维能力、演讲能力,而他的生平介绍却是其次的,因为,我们在他的简历中已经对其有所了解。我的目的是:应聘者是有感恩的心态,还是有仇恨的心态。

2024-06-24 12:30:00 605

原创 网络分层之7层讲解

要传递信息就要利用一些物理媒体,如双纽线、同轴电缆等,但具体的物理媒体并不在OSI的7层之内,有人把物理媒体当作第0层,物理层的任务就是为它的上一层提供一个物理连接,以及它们的机械、电气、功能和过程特性。该层的任务时根据通信子网的特性最佳的利用网络资源,并以可靠和经济的方式,为两个端系统(也就是源站和目的站)的会话层之间,提供建立、维护和取消传输连接的功能,负责可靠地传输数据。Note:有一些连接设备,如网桥或交换机,由于它们要对帧解码并使用帧信息将数据发送到正确的接收方,所以它们是工作在数据链路层的。

2024-06-24 09:00:00 1299

原创 数据结构-堆

(Heap)是一种特别的树状数据结构。若是满足以下特性,即可称为堆:“给定堆中任意节点P和C,若P是C的母节点,那么P的值会小于等于(或大于等于)C的值”。若母节点的值恒子节点的值,此堆称为(min heap);反之,若母节点的值恒子节点的值,此堆称为(max heap)。在堆中最顶端的那一个节点,称作(root node),根节点本身没有(heap sort),提出了二叉堆树作为此算法的数据结构。

2024-06-23 15:45:00 829

原创 TCP 三次握手

SYN-ACK重传次数服务器发送完SYN-ACK包,如果未收到客户确认包,服务器进行首次重传,等待一段时间仍未收到客户确认包,进行第二次重传,如果重传次数超过系统规定的最大重传次数,系统将该连接信息从半连接队列中删除。客户端再次发送确认包(ACK),SYN 标志位为0,ACK 标志位为1,并且把服务器发来 ACK 的序号字段+1,放在确定字段中发送给对方,并且在数据段放写ISN的+1。服务器端确认客户端的 FIN 包,发送一个确认包,表明自己接受到了客户端关闭连接的请求,但还没有准备好关闭连接。

2024-06-23 11:15:00 1406

原创 4字节十进制数 转为 IPV4点分十进制 -- C++语言实现

【代码】4字节十进制数 转为 IPV4点分十进制 -- C++语言实现。

2024-06-22 16:30:00 458

原创 C++必会100题精(面试笔试有用)

5.已知一个类X, _____C_____是定义指向类X成员函数的指针,假设类有3个公有成员: void f1(int), void f2(int)和int a.54.类B是类A的公有派生类,类A和类B中都定义了虚函数func(),p是一个指向类A对象的指针,则p->A::func()将( A )9.已知f1(int)是类X的公有成员函数,p是指向成员f1()的指针,采用它赋值, ____ B ______是正确的.8.已知p是一个指向类X数据成员m的指针,s是类X的一个对象;

2024-06-22 12:15:00 1158

原创 模电复习题

在下图所示放大电路中,已知VCC=12V,Rb1=27kΩ,Rc=2kΩ,Re=1kΩ,UBE=0.7V,现要求静态电流 ICQ=3mA ,则 Rb2 约为()。已知U2=20V,稳压管的UDZ=9V,R=300Ω,RL=300Ω。正常情况下,电路的输出电压UO为()。下图所示共基放大电路的三极管为硅管,UBE=0.7V,rbb’=200Ω,β=100,可求得该电路的电压放大倍数为()。下图所示共基放大电路的三极管为硅管,UBE=0.7V,rbb’=200Ω,β=100,可求得该电路的输出电阻Ro为()。

2024-06-21 17:15:00 2298

原创 威泰视信嵌入式软件工程师笔试题

硬件看门狗,又叫 watchdog timer,是一个定时器电路, 一般有一个输入,叫喂狗,一个输出到MCU的RST端,MCU正常工作的时候,每隔一端时间输出一个信号到喂狗端,给 WDT 清零,如果超过规定的时间不喂狗,(一般在程序跑飞时),WDT 定时超过,就回给出一个[复位信号]到MCU,是MCU复位. 防止MCU死机. 看门狗的作用就是防止程序发生死循环,或者说程序跑飞。只要你代码或配置有改动,都要重新编译的,只是如果代码写成块模式的,不用整个代码都重新编译,编译器会自动编译改动了的代码。

2024-06-21 11:00:00 2127

最新开发基于深度学习的植物病害智能识别系统python源码+说明+数据(可做毕设).zip

最新开发基于深度学习的植物病害智能识别系统python源码+说明+数据(可做毕设).zip 深度学习框架: PyTorch 2.0+ 模型架构: 自定义CNN 数据增强: 颜色抖动、几何变换、随机擦除、Mixup 正则化: Dropout、Label Smoothing、Weight Decay 优化策略: AdamW + Cosine Annealing + Early Stopping 识别类别如下 健康叶片 (healthy) 叶斑病 (leaf_spot) 锈病 (rust) 白粉病 (powdery_mildew) 黑斑病 (black_spot)

2026-01-09

基于机器学习和遥感技术预测水体中叶绿素-a浓度和总悬浮固体(TSS)浓度的解决方案(完整源码+数据).zip

该项目是一个利用机器学习和遥感技术预测水体中叶绿素-a浓度和总悬浮固体(TSS)浓度的解决方案。由Vizlab | X-Reality和地理信息实验室开发,作为一种经济高效的水质监测替代方案,避免昂贵的实验室样本采集。该方法已在两个研究区域验证,两个模型的R²值均超过0.8。项目包含完整的Jupyter Notebook代码、已发表的论文和测试数据集。 主要功能 通过机器学习算法预测水体中的叶绿素-a浓度 预测总悬浮固体(TSS)浓度 基于遥感数据进行水质参数估算 无需直接采样的经济高效监测方案 技术栈 Python科学计算库:numpy、pandas、scipy 机器学习框架:scikit-learn、keras 数据可视化:seaborn、matplotlib 开发环境:Google Colab

2026-01-07

一个时间依赖型车辆路由问题求解器-采用混合元启发式算法python实现+数据.zip

一个时间依赖型车辆路由问题求解器-采用混合元启发式算法python实现+数据.zip 是一个时间依赖型车辆路由问题求解器,采用混合元启发式算法实现。该项目使用遗传算法、局部搜索和大邻域搜索相结合的方法,对具有时间窗口约束的车辆路由问题进行优化。项目包含了Solomon基准数据集,可用于性能评估。 主要功能点 遗传算法(GA):作为核心优化技术,通过迭代演化种群寻找更优路线 局部搜索:改进解的质量,通过探索当前解的邻域来优化 大邻域搜索(LNS):进行大规模邻域探索,寻找多样化的高质量解 时间依赖型旅行时间:基于离散速度函数估算位置间的旅行时间 性能评估:追踪并报告最佳适应度值、解序列和执行时间 约束处理:支持车辆容量和时间窗口约束

2026-01-07

基于遗传算法(GA)和粒子群优化算法(PSO)求解带时间窗的车辆路由问题项目源码.zip

基于遗传算法(GA)和粒子群优化算法(PSO)求解带时间窗的车辆路由问题项目源码.zip 使用遗传算法(GA)和粒子群优化算法(PSO)求解带时间窗的车辆路由问题(VRPTW)的求解器。项目包含四个主要模块:数据预处理、核心函数、算法创建器和应用执行。用户可以通过命令行指定问题实例和算法类型来运行求解器,支持多种参数调整以优化算法性能。 【功能简介】 支持GA和PSO两种算法求解VRPTW问题 灵活的参数配置系统,覆盖输入数据、迭代次数、种群大小、遗传操作概率等多个维度 数据预处理模块用于转换问题实例格式 集成DEAP框架的Toolbox和Creator容器支持 结果统计和日志记录功能 技术栈 编程语言:Python 核心框架:DEAP(分布式进化算法库) 算法类型:遗传算法(GA)、粒子群优化(PSO) 应用场景:组合优化问题

2026-01-07

800M无人机音频检测和识别的音频数据集.zip

800M无人机音频检测和识别的音频数据集.zip 该数据集由室内环境中录制的无人机螺旋桨噪音组成,并通过随机噪音片段进行了人工增强。数据集包含二分类和多分类两种标注格式,其中"未知"类别的噪音来自开源项目ESC-50和语音命令数据集,同时还包含自创的静音音频片段以平衡数据集。该项目是IWCMC 2019学术会议论文《基于音频的无人机深度学习检测与识别》的配套资源。 主要功能 提供室内环境录制的真实无人机螺旋桨噪音数据 包含二分类(是/否无人机)和多分类标注版本 通过ESC-50和语音命令数据集进行数据增强 支持深度学习模型训练用于无人机音频检测和识别 包含平衡的数据集(无人机音频 + 环境噪音 + 静音)

2026-01-04

生产级无人机声学检测系统-通过声学特征识别(含源码及说明).zip

生产级无人机声学检测系统-通过声学特征识别(含源码及说明) 产级深度学习系统,专门用于通过声学特征识别无人机/无人飞行器的威胁。该系统能够实时监听环境音频,将原始音频波形转换为梅尔频谱图(Mel-Spectrogram),并使用自定义卷积神经网络(CNN)将音频分类为"威胁(无人机)"或"安全(背景噪音)"。该项目采用模块化设计,支持自动数据集获取、优先保证高召回率的防御级指标、模型检查点保存和实时推理API。

2026-01-04

新项目-基于深度学习的中医舌诊智能辅助系统(集成目标检测、图像分割和大语言模型技术,能够对舌头图像进行多维度分析).zip

基于深度学习的中医舌诊智能辅助系统(集成目标检测、图像分割和大语言模型技术,能够对舌头图像进行多维度分析).zip 基于深度学习的中医舌诊智能辅助系统。该项目集成了目标检测、图像分割和大语言模型技术,能够对舌头图像进行多维度分析,包括舌色、舌苔颜色、厚度和腻度的识别。系统提供跨平台Web应用,支持Windows/macOS/Linux,并在V2.0版本中集成了Deepseek-r1-14B大语言模型,实现了智能诊断引擎和自然语言问答咨询功能。 主要功能 四维舌象分析:精确识别舌色、舌苔颜色、厚度和腻度 自动化处理管道:YOLOv5舌头定位 → Segment Anything分割 → ResNet50分类 跨平台Web应用:浏览器访问,支持多个操作系统 智能诊断引擎:集成LLM实现多维度健康评估和自然语言咨询 用户认证与会话管理:JWT令牌认证和数据库持久化存储 技术栈 后端:Python 3.9.21、FastAPI、SQLite 3.35+ 深度学习:YOLOv5、Segment Anything (SAM)、ResNet50、UNet 大语言模型:Deepseek-r1:14b (通过Ollama) 前端:Vue.js、Vite、TypeScript、Electron (桌面应用) 开发工具:Conda、npm、Cypress (测试)

2026-01-04

牙齿分割挑战赛第一名作品完整源码-0.9621IoU含训练代码、推理脚本和预训练模型权重.zip

牙齿分割挑战赛第一名作品完整源码-0.9621IoU含训练代码、推理脚本和预训练模型权重 通过数据增强、损失函数优化、TTA推理和模型融合等技术,在有标签和无标签混合数据上进行半监督学习,最终在测试集上达到0.9621的IoU分数。项目提供完整的Docker部署方案,包括训练代码、推理脚本和预训练模型权重。 主要功能 基于MixVisionTransformer (MIT-B1/B2/B3) 和MAnet的语义分割模型 支持Test Time Augmentation (TTA) 的多角度推理策略 半监督学习框架,利用伪标签和信息熵筛选训练 5折交叉验证和多模型融合集成 完整的Docker容器化部署方案 支持GPU加速推理 (需要16G以上显存)

2025-12-27

基于MATLAB-Simulink的混合动力电动汽车(HEV)仿真模型项目源码+说明文档.zip

混合动力电动汽车(HEV)模型是一个基于MATLAB/Simulink的开源项目,展示了功率分流式混合动力汽车的系统级仿真。该项目采用模块化设计方法,使用子系统引用(Subsystem Reference)构建电机、发动机、功率分流装置等物理组件,并包含基于规则的速度跟踪控制器。模型运行速度超过实时,适合纵向车辆行为的系统级仿真研究。项目由MATLAB项目管理,各组件配备独立的测试设置,支持MATLAB R2023a及更早版本。 主要功能 功率分流式混合动力汽车的抽象模型实现 基于规则的简化控制器用于速度跟踪仿真 模块化物理建模工作流,采用子系统引用技术 电机、发动机、功率分流装置等核心组件的独立构建与测试 超实时运行性能,适合系统级仿真分析 完整的项目管理和单元测试框架 技术栈 MATLAB/Simulink(核心仿真平台)

2025-12-26

基于MATLAB的混合动力汽车仿真应用源码+文档说明及全部资料.zip

基于MATLAB的混合动力汽车仿真应用源码+文档说明及全部资料.zip

2025-12-26

基于实时CCTV图像数据的AI驱动的非法停车检测和执法路线推荐系统-毕设.zip

基于实时CCTV图像数据的AI驱动的非法停车检测和执法路线推荐系统-毕设.zip 旨在建设一个基于实时CCTV图像数据的AI驱动的违法停车检测和执法路线推荐系统。该系统采用三层架构设计,分离升级、增量和数据库,增强可扩展性和稳定性项目。通过自动检测违法停车位置、计算最优化执法路线、提供实时板可视化等功能,帮助执法部门提高效率。系统包含用户端(仪表、举报、搜索)和管理员端(执法管理、用户管理、权限控制)的完整功能。 主要功能 自动检测:通过CCTV和车辆位置数据联动自动识别违章停车 路线推荐:分析执法目标位置并计算最优执法路线 实时仪表板:基于地图的执法现状可视化和报告页面 用户功能:登录/注册、举报提交、综合搜索 管理员功能:执法和用户管理、系统设置、权限分离 安全保障:个人信息加密、权限分离控制 技术栈 前端:React.js、Tailwind CSS 通讯:Node.js (Express) / Python (Flask) 数据库:PostgreSQL / MongoDB

2025-12-26

基于YOLOv5的城市街道道路占用和车辆违停检测系统+项目说明文档+模型(本科毕设作品).zip

基于YOLOv5的城市街道道路占用和车辆违停检测系统+项目说明文档(本科毕设作品).zip 基于YOLOv5的城市街道道路占用和车辆违停检测系统。该项目能够实现对道路占用行为和车辆非法停车的自动检测,支持用户自定义检测区域划分,并提供实时反馈功能。项目主要用于城市交通管理和执法场景。 基于YOLOv5深度学习模型的目标检测 道路占用行为检测 车辆违法停车检测 自定义检测区域划分功能 实时检测反馈 支持图片和短视频的检测处理

2025-12-26

基于YOLO和DeepSORT的实时违停检测系统源码+文档说明资料(毕设课设作品).zip

基于YOLO和DeepSORT的实时违停检测系统源码+文档说明资料(毕设课设作品).zip 一个基于计算机视觉的非法停车检测系统。项目利用YOLO实时目标检测和Deep SORT多目标跟踪技术,监控视频流中的车辆,识别进入禁停区的车辆,并为每辆车分配唯一ID进行持续跟踪。当车辆在禁停区停留超过设定时间阈值时,系统将其标记为非法停车。该解决方案可保存违规事件的详细信息(包括车辆ID、时间戳和图像),适用于停车场、商场、政府管制区域等自动化监控场景。 主要功能 实时车辆检测和识别(基于YOLO) 多车辆跨帧持续跟踪(基于Deep SORT) 禁停区域监控和违规判定 自动化违规事件记录和证据保存 支持JSON日志和JPEG图像输出 技术栈 YOLO(You Only Look Once)- 实时目标检测 Deep SORT - 多目标跟踪算法 Python - 主要编程语言 计算机视觉和视频处理

2025-12-26

毕设-基于FPGA的实时图像处理系统(使用Verilog语言实现OV2640摄像头、蓝牙模块和VGA显示的交互,能够捕获图像信息、进行图像缓冲和处理,最后通过VGA实时显示处理后的图像).zip

一个基于FPGA的实时图像处理系统。该项目使用Verilog语言实现OV2640摄像头、蓝牙模块和VGA显示的交互,能够捕获图像信息、进行图像缓冲和处理,最后通过VGA实时显示处理后的图像。用户可以通过蓝牙模块用手机远程控制不同的滤波处理模式,所选模式通过数码管显示在FPGA开发板上。 【主要功能】 OV2640摄像头图像捕获和实时处理 图像数据缓冲和存储管理 多种滤波模式支持(可通过蓝牙切换) VGA实时显示输出 蓝牙无线遥控功能 数码管模式显示 技术栈 硬件语言:Verilog、VHDL、SystemVerilog FPGA开发工具:Vivado 2016.2 目标硬件:Nexys 4 DDR FPGA开发板 外部模块:OV2640摄像头、VGA显示、PS2接口、蓝牙从机UART模块

2025-12-24

一个用Verilog实现的FPGA图像处理库-专门为Ice40等低端FPGA设备设计.zip

一个用Verilog实现的FPGA图像处理库-专门为Ice40等低端FPGA设备设计 一个在Verilog中实现图像处理操作的项目,支持在Verilator仿真环境或Ice40 FPGA上运行。该项目针对低端FPGA设备(如Ice40 Ultraplus)进行了优化,使用1Mbit RAM存储图像到两个缓冲区(输入缓冲和存储缓冲)。项目提供了丰富的图像处理操作,包括像素级运算、矩阵卷积、二元操作等,并通过SPI接口与主机通信。 主要功能点 支持多种图像处理操作:加/减、反演、阈值处理、乘/除等 3x3矩阵卷积运算(可应用于存储缓冲或输入缓冲) 二元操作:加、减、乘、切换缓冲区 图像加载、读取和处理命令接口 双缓冲架构支持两种工作模式:Verilator仿真和Ice40 FPGA硬件运行 SPI通信接口用于FPGA与主机交互 固定点数学运算支持(8位:1符号位、3整数位、4小数位) 技术栈 HDL语言:Verilog(45.6%) 编程语言:C(28.1%)、C++(25.1%) 仿真工具:Verilator 3.874 FPGA工具链:Yosys 0.9 通信库:FTDI lib(libftdi-lib0.20) 可视化工具:Gnuplot 5.0 目标硬件:Ice40 Ultraplus FPGA

2025-12-24

基于Mamba的多元时间序列预测项目源码+说明文档资料.zip

基于 Mamba 架构的多元时间序列预测模型实现。该项目采用系列嵌入方法让 Mamba 学习系列之间的关联性,相比 Transformer 在保证建模能力相同的前提下消耗更少的显存。项目在多个长期时间序列预测基准测试上表现优异,包括 ETTh1、ECL 和 Traffic 等数据集。 主要功能 可逆实例归一化层:对各个系列进行归一化处理,解决分布偏移问题 线性嵌入层:将单个系列投影到嵌入空间 双向 Mamba 块:替代传统 Transformer 中的自注意力机制,包含正向和反向扫描 前馈网络(FFN):功能类似于 Mamba 模块的集合,但显存消耗更少 通道混合与独立模式:支持两种模式以适应不同的系列相关性特征 时间特征支持:可添加时间戳特征(如月份、周期、小时等)增强预测 技术栈 深度学习框架:PyTorch 核心模型:Mamba 架构 环境管理:Miniconda/Conda 编程语言:Python、Shell 相关库:依赖项已在 requirements.txt 中列出(已移除 timm 库)

2025-12-23

基于深度Q学习实现的多智能体追逃博弈问题的研究项目源码+说明文档资料.zip

使用深度Q学习实现的多智能体追逃博弈问题的研究项目。项目模拟了一个零和游戏场景,其中智能追捕者和智能逃避者在包含障碍物的环境中进行对抗。追捕者的目标是尽快捕获逃避者,逃避者的目标是逃离追捕。所有智能体初始状态相同且对环境未知。游戏通过碰撞、与障碍物接触或被捕获而结束。项目采用深度强化学习方法,智能体根据动作获得奖励或惩罚,并将这些信息更新到神经网络中以改进性能。 【主要功能】 多智能体追逃博弈环境模拟 深度Q学习强化学习算法实现 动态障碍物和地图边界检测 智能体奖励惩罚机制设计 零和博弈场景下的性能优化 技术栈 Python编程语言 深度Q学习(Deep Q-Learning)算法 神经网络 多智能体强化学习框架

2025-12-21

毕设基于Matlab与神经网络的多方法电力系统状态估计套件源码+文档说明.zip

毕设基于Matlab与神经网络的多方法电力系统状态估计套件源码+文档说明.zip 一个关于电力系统状态估计的开源项目。该项目包含多种算法模型实现,包括加权最小二乘法(WLS)、加权最小绝对值法(WLAV)以及神经网络模型(前馈神经网络和LSTM)。项目提供了训练和测试数据集,支持IEEE 118节点系统的状态估计计算。 【主要功能】 加权最小二乘法(WLS)状态估计实现 加权最小绝对值法(WLAV)状态估计实现(MATLAB版本) 前馈神经网络模型用于状态估计 LSTM神经网络模型用于状态估计 包含训练和测试数据集(loadprofile-train.xls 和 loadprofile-test.xls) 支持IEEE 118节点系统 技术栈 Python(占比65.6%) MATLAB(占比34.4%)

2025-12-20

一体化酒店管理系统(后台+网站+微信小程序,支持订单房态点餐微信支付)源码+文档说明及资料.zip

一体化酒店管理系统(后台+网站+微信小程序,支持订单房态点餐微信支付)源码+文档说明及资料.zip 项目树状结构: 项目目录/ ├─.vscode/#开发环境VSCode配置 ├─app/#后端应用(controller/model/service/view等)#包含socket/io、定时任务与业务逻辑 ├─config/#应用配置(数据库/Redis/weapp等) ├─database/#migrations与seeders(sequelize)#包含hotel.sql示例数据 ├─test/app/controller/#测试用例目录(按模块组织) ├─weapp/#微信小程序源码(小程序前端) ├─www/#网站前端打包文件(静态站点) ├─app.js#后端入口(Node/Egg.js应用启动文件) ├─hotel.sql#数据库示例导入脚本 ├─package.json#Node依赖与启动脚本 ├─项目说明.md 功能介绍:该项目提供一个开箱即用的酒店管理平台,后端基于Egg.js(支持socket.io、JWT、Redis),前端网站与微信小程序均支持在线预订、订单管理、点餐绑定房间、微信支付与退款、房态实时推送与后台管理面板,适用于需要微信生态与网站双端运营的酒店场景。 使用技术栈:Node.js(Egg.js),MySQL(Sequelize),React+AntDesign(前端),微信小程序(VantWeapp),Socket.io,Redis。

2025-12-12

Simulink+FlightGear的实时直升机飞行仿真平台源码+文档说明及全部资料.zip

Simulink+FlightGear的实时直升机飞行仿真平台源码+文档说明及全部资料 基于Simulink和Matlab的实时飞行模拟项目,用于求解飞行动力学方程,并通过Flightgear进行3D可视化。项目以De Havilland DHC-2"Beaver"飞机为例进行模拟,但支持通过修改飞机参数来适配其他飞机型号。该项目是开罗大学航空航天工程系AER307A飞行力学课程的小组项目作品。 主要功能点 使用Simulink和Matlab求解飞行动力学方程 与Flightgear进行实时数据交互,提供3D可视化 支持多架飞机模型配置(通过修改气动系数、质量、惯性矩等参数) 控制面调节功能(滑块增益控制) 包含完整的飞行报告和项目文档 技术栈 主要语言: MATLAB (87.2%) 仿真平台: Simulink 可视化工具: Flightgear 脚本: Shell (7.0%), Batch文件 (5.8%)

2025-12-06

面向医疗大数据的糖尿病风险预测综合分析python源码+文档说明+数据集(毕设项目).zip

面向医疗大数据的糖尿病风险预测综合分析python源码+文档说明+数据集(毕设项目).zip 该项目利用医疗和人口统计数据构建机器学习模型预测患者糖尿病状态。数据集包含性别、年龄、BMI、高血压、心脏病、吸烟史、HbA1c水平和血糖水平等特征。项目通过数据清洗、探索性数据分析(EDA)、可视化和机器学习模型开发,旨在帮助医疗专业人士识别高风险患者并制定个性化治疗计划。 【主要功能】 数据清洗与探索分析 数据可视化与描述统计 处理不平衡数据的机器学习建模 糖尿病风险预测 Tableau交互式可视化展示 【技术栈】 Jupyter Notebook Python数据分析库 机器学习模型 Tableau(数据可视化) Anaconda(环境管理)

2025-12-06

基于生成对抗网络的人脸图像生成项目(使用JupyterNotebook)源码+文档说明及全部资料.zip

基于生成对抗网络的人脸图像生成项目(使用JupyterNotebook)源码+文档说明及全部资料.zip 基于生成式对抗网络(GAN)的深度学习项目,属于优达学城深度学习纳米学位课程的一部分。项目通过实现GAN算法来生成逼真的人脸图像,使用MNIST和CelebA数据集进行训练,采用Xavier权重初始化方法以加速收敛和降低损失函数值。项目包含完整的Jupyter Notebook实现代码、辅助函数和单元测试。 主要功能 使用GAN(生成式对抗网络)生成新的人脸图像 支持多个数据集训练(MNIST和CelebA) 采用Xavier初始化方法优化网络收敛 包含完整的项目实现和测试框架 提供Jupyter Notebook交互式学习环境 技术栈 TensorFlow 1.3.0 Python Jupyter Notebook 生成式对抗网络(GAN) Xavier权重初始化

2025-12-06

基于天池大赛的O2O优惠券核销预测项目+说明+全部资料.zip

基于天池大赛的O2O优惠券核销预测项目+说明+全部资料.zip 这是一个基于天池大赛的O2O优惠券核销预测项目。该项目利用用户2016年1月至6月的真实线上线下消费行为数据,预测用户在领取优惠券后15天内的核销行为。最终成绩排名前1%,AUC达到0.7948(Top1为0.8116)。 主要功能点 特征工程:采用滑动窗口(SW)方式进行特征提取,处理测试集特征缺失问题;进行缺失值处理、二值化、One-Hot编码、数据变换和特征选择 模型选择与优化:对比多种算法(LR、SVM、RF、GBDT、XGBoost),最终选择XGBoost;使用交叉验证和网格搜索进行参数调优 模型融合:采用加权平均和两层Stacking融合方式,通过融合过拟合和欠拟合模型获得最优结果 迭代优化:根据提交结果循环调整特征、模型参数和融合策略 技术栈 编程语言:Python 核心算法:XGBoost、GBDT、Random Forest、SVM、Logistic Regression 优化方法:交叉验证、网格搜索、模型融合(Stacking、加权平均) 评估指标:AUC(Area Under Curve)

2025-12-03

四驱智能小车-基于树莓派(黑线循迹、超声波避障、红外遥控等功能,含源码+项目说明).zip

基于树莓派开发的四驱智能小车项目完整源码及资料(黑线循迹、超声波避障、红外遥控等功能+项目说明).zip 基于树莓派4B的四驱智能小车项目,采用低压直流电池供电,集成多种传感器系统。该项目实现了黑线循迹、超声波避障、红外遥控、网络远程驾驶、磁轨控制和AI红绿灯识别等多种功能。采用亚克力双层结构设计,集成化程度高,使用TB6612FNG电机驱动芯片和PWM无极调速技术。特色功识别系统采用YOLOv5m模型在云服务器上训练,可实现远程第一视角超视距驾驶。项目包含详细的环境配置、传感器集成、深度学习模型训练部署等完整开发流程。 主要功能点 黑线循迹导航(三路TCRT5000传感器) 超声波和红外双重避障系统(含舵机转向) 红外遥控控制(支持前后左右移动和紧急停止) 网络远程遥感驾驶(树莓派OV5647摄像头+大疆Osmo Pocket云台系统) 磁轨控制系统(N/S霍尔传感器+磁钉虚拟轨道) AI计算机视觉红绿灯识别(YOLOv5m深度学习模型) 蜂鸣器音乐播放、LED指示灯、数码管电压显示 技术栈 硬件:树莓派4B (2GB RAM)、TT电机×4、TB6612FNG驱动芯片、HC-SR04超声模组、OV5647摄像头、大疆Osmo Pocket、7.4V锂电池 操作系统:Raspberry Pi OS Full (64-bit)

2025-12-02

以IEEE39为例的Python电力系统潮流计算实现源码+文档说明及全部资料.zip

以IEEE39为例的Python电力系统潮流计算实现源码+文档说明+数据集.zip 电力系统潮流计算项目,采用牛顿-拉夫逊法(牛拉法)和PQ分解法两种算法实现潮流计算,并进行N-1应急校核。项目以IEEE 39节点标准测试系统为例,所有计算结果均已通过PowerWorld软件验证。该项目是电力系统课程设计的代码实现部分,主要参考《电力系统分析》教材。 主要功能 牛顿-拉夫逊法(Newton-Raphson)潮流计算 PQ分解法潮流计算 N-1应急校核(单条线路故障分析) 节点电压、功率、电流等参数计算与输出 故障条件下电压数据分析 技术栈 编程语言:Python 100% 数据格式:IEEE标准数据格式(.DAT文件) 验证工具:PowerWorld 数据输出:CSV格式

2025-11-25

人工智能课设基于Sklearn模型的机器学习股票预测项目源码与分析python源码+设计报告.zip

人工智能课设基于Sklearn模型的机器学习股票预测项目源码与分析python源码+设计报告.zip 基于scikit-learn机器学习模型的股票预测项目。该项目利用Python和sklearn库建立机器学习模型,用于股票价格预测和分析。项目包含数据处理、模型训练等相关代码,主要用于学习和研究目的。 主要功能 基于sklearn机器学习框架的股票预测模型 数据获取与处理模块 多种机器学习算法实现与对比 预测结果分析与可视化 技术栈 Python(100%) scikit-learn(sklearn)

2025-11-20

python基于多种深度学习模型自动为时尚图片生成自然语言描述项目源码+数据集+学习资料.zip

python基于多种深度学习模型自动为时尚图片生成自然语言描述项目源码+数据集+学习资料.zip 基于编解码框架的图像描述生成项目,是2023年北京邮电大学深度学习与神经网络课程设计作品。项目实现了多个图像描述模型,包括初始模型、自注意力+注意力机制模型和Transformer编解码器模型,并探索了多模态学习(BLIP)和强化学习损失函数等扩展功能。项目提供了完整的数据集、模型实现、评估指标(METEOR、ROUGE-L、CIDEr-D)和优化方案。 主要功能点 多个图像描述模型的实现(初始模型、Self-Attention+Attention、Transformer E+D) 支持网格特征表示的编解码框架 集成多个评估指标(METEOR、ROUGE-L、CIDEr-D) 附加功能:多模态模型(BLIP)集成 附加功能:基于强化学习的损失函数优化 完整的数据处理和预处理流程 技术栈 Python编程语言 Transformer架构 深度学习框架(PyTorch/TensorFlow) 自注意力机制 多模态学习模型(BLIP) 强化学习优化 Jupyter Notebook

2025-11-18

北邮人工智能专业-BUPT神经网络与深度学习课程设计含完整源码、数据集资料等(基础的CNN+GRU模型到先进的Transformer架构).zip

北邮人工智能专业-BUPT神经网络与深度学习课程设计含完整源码、数据集资料等(基础的CNN+GRU模型到先进的Transformer架构).zip 本项目是北京邮电大学22级人工智能专业《神经网络与深度学习》课程设计,旨在使用多种深度学习模型自动为时尚图片生成自然语言描述。项目采用DeepFashion-MultiModal数据集,实现了从基础的CNN+GRU模型到先进的Transformer架构,再到大模型微调(Qwen2-VL)的完整技术方案。通过BLEU、METEOR、ROUGE、CIDEr四种评价指标对模型性能进行全面评估,最终对比自训练模型与预训练大模型的差异。 主要功能 实现多种图像描述生成模型架构(CNN+GRU、CNN+GRU+GloVe、Attention机制、Transformer编码解码器) 支持区域特征表示和全局特征表示的图像编码方式 集成自注意力机制和交叉注意力机制 提供Qwen2-VL大模型微调功能(需要30GB+显存) 实现四种标准评价指标用于模型性能评估

2025-11-18

人体检测数据集.zip

人体检测数据集.zip

2025-11-12

146张人形测试数据.zip

146张人形测试数据.zip

2025-11-12

archive.zip

archive.zip

2025-11-12

lightly-train-main.zip

lightly-train-main.zip

2025-11-11

FileZilla-Server-1.11.1-x86-64-linux-gnu.deb

FileZilla_Server_1.11.1_x86_64-linux-gnu.deb

2025-11-07

FileZilla-3.69.3-win64-sponsored2-setup.exe

FileZilla_3.69.3_win64_sponsored2-setup.exe

2025-11-07

tftpd32-tool.zip

tftpd32_tool.zip

2025-11-07

matlab实现基于DDPG强化学习与PID的温度控制仿真系统源码+文档说明及+PPT.zip

matlab实现基于DDPG强化学习与PID的温度控制仿真系统源码+文档说明及+PPT.zip 通过MATLAB和Simulink环境,使用DDPG深度强化学习模型与传统的PID控制器和恒温器控制器在温度控制任务上的性能。项目包含完整的模型实现、训练代码和性能评估。根据实验结果,PID控制器表现最好(MSE: 23.9247),其次是DDPG RL代理(MSE: 26.8667),恒温器控制器最差(MSE: 32.7782)。 主要功能点 使用DDPG(深度确定性策略梯度)强化学习算法实现温度控制 实现PID离散控制器用于温度管理 实现传统恒温器控制逻辑作为基准 支持基于Simulink的建模和仿真 可自定义奖励函数以优化模型性能 提供完整的性能对比分析(MSE指标) 技术栈 MATLAB 2020及更高版本 Simulink仿真环境 强化学习工具箱(Reinforcement Learning Toolkit) 机器学习工具箱(Machine Learning Toolkit) PID调谐工具箱(PID Tuner) 编程语言:100% MATLAB

2025-11-05

基于Mediapipe人体姿态识别的AI健身系统(俯卧撑和仰卧起坐的运动识别).zip

基于Mediapipe人体姿态识别的AI健身系统(俯卧撑和仰卧起坐的运动识别).zip 项目简介: 本项目通过对前端微信小程序采集到的姿势特征图像通过后端flask接口调用,将图像上传至后端,在后端搭建基于MediaPipe Pose的算法系统,将相关姿态数据回传至前端小程序,在前端的算法中判断健身者的运动姿态,动作行程等运动特征是否符合标准动作要求,对其标准动作与各类非标准动作分别计数,并将结果实时显示在小程序运动界面,同时将运动记录上传至历史记录存储在数据库中。 基于人体姿态识别的AI健身系统,采用微信小程序和后端Python接口实现,调用Mediapipe姿态特征点识别,目前已完成对俯卧撑和仰卧起坐的运动识别。 对于俯卧撑,则取点11、13、15确定肘关节角度,取点13、11、23确定肩部角度,取点11,23,25确定髋关节角度。对于仰卧起坐,取点11,23,25确定髋关节角度,取点23,25,27确定膝盖弯曲角度。再对这些角度进行算法判断,从而完成对运动状态的判断。 2. 图片前后端的传输 由于前端采用的是小程序实现,后端采用的是Python进行姿态特征点的识别。摄像头采集的图像是从前端小程序采集的,因此需要将前端采集的图像传回后端利用Python进行识别预测,再将上述的各关节的角度返回给前端,在前端中撰写算法完成判断。 因此,后端采用Flask接口实现。详细实现 3. 数据库设计 在小程序中存储了历史运动数据,采用微信云平台作为数据库,设计了三张表,分别是用户user,俯卧撑sportRecord和仰卧起坐situp。在用户表中创建了openid,头像和昵称的属性,用来存储用户的数据,身高和体重属性则存储对应用户的身高和体重。在俯卧撑表中创建了五个属性,分别为运动的结束,正确的个数以及三处错误情况的计数。仰卧起坐表亦如此,创建了四个属性存储对应的仰卧起坐数据。

2025-10-27

数字图像处理-基于YOLOv8目标检测和MediaPipe实时手势识别的智能图像处理系统完整源码+说明资料+onnx模型.zip

数字图像处理-基于YOLOv8目标检测和MediaPipe实时手势识别的智能图像处理系统完整源码+说明资料.zip 本项目是一个基于YOLOv8目标检测和MediaPipe实时手势识别的智能图像处理系统,除传统图像处理功能外,实现了甲骨文识别和手势交互控制两大核心功能 本数字图像处理系统是基于Python和PyQt5开发的综合性图像处理平台,采用YOLOv8深度学习框架实现高精度甲骨文识别,结合MediaPipe实现实时手势控制交互。系统整合了OpenCV、NumPy等核心计算机视觉库,构建了包含传统图像处理算法(如边缘检测、形态学操作等)与深度学习技术的混合处理流水线,具有跨平台、模块化、低延迟等技术特点,既可作为教学演示工具,也能满足实际工程应用需求。 pip install -r requirements.txt 运行主程序: python main_code/main.py

2025-10-27

基于YOLOv8的甲骨文原始拓片图像单字分割识别项目比赛源码+文档说明资料等.zip

基于YOLOv8的甲骨文原始拓片图像单字分割识别项目比赛源码+文档说明资料等.zip 针对原始拓片图像中的甲骨文文字分割识别包括以下两个阶段: 目标检测:基于 YOLOv8 目标检测模型,对甲骨文文字所在的矩形区域进行提取。 字符识别:基于 YOLOv8 图像分类模型,对文字图像进行分类,判断该字形所代表的具体字符内容。 同时实现基于 Flask 的后端推理接口和 Web UI 可视化界面。

2025-10-27

yolov5-7.0.zip

yolov5-7.0.zip

2025-10-23

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除