- 博客(83)
- 资源 (12)
- 收藏
- 关注
原创 DeepSORT 目标追踪算法详解
DeepSORT 凭借其高效的实时性和稳定的追踪效果,已成为多目标追踪领域的基准算法。通过合理选择检测器、优化Re-ID模型及调整参数,可显著提升其在复杂场景下的性能。领域的经典算法,通过结合目标检测、运动预测和外观特征匹配,实现了高效、稳定的实时追踪。MOTA=1−漏检数+误检数+ID切换数总目标数MOTA=1−总目标数漏检数+误检数+ID切换数。:将大模型(如ResNet50)蒸馏至轻量模型(如MobileNetV2)。:提取目标的深度特征(128维或256维向量),用于区分不同目标。
2025-03-19 14:48:01
843
原创 基于深度学习的目标追踪技术全解析
模拟遮挡训练鲁棒表示(Occlusion-Aware R-CNN)。:引入区域建议网络(RPN),联合分类与回归提升定位精度。:FP16/INT8量化与层融合(NVIDIA GPU)。:逐帧检测目标,通过数据关联(匈牙利算法)跨帧链接轨迹。:融合YOLO检测与Re-ID特征,卡尔曼滤波预测轨迹。:卷积与Transformer结合,平衡局部与全局信息。:FAIR的检测与追踪平台(集成Mask R-CNN)。:CLIP模型实现未知类别追踪(如OVTrack)。:联合训练检测与Re-ID,解决特征不一致问题。
2025-03-19 14:31:40
905
原创 目标追踪综述
目标追踪的核心任务可定义为:给定视频序列初始帧中目标的标注信息(通常为边界框或掩码),在后续每一帧中预测目标的时空状态(位置、尺度、运动轨迹等)。其核心挑战在于如何建模目标的外观与运动特征,并应对复杂环境干扰(如遮挡、光照变化、背景杂波等)。
2025-03-06 16:15:52
662
原创 android实现串口接入
准备一个兼容Android的USB-to-Serial转换器。这些设备带有相应的驱动程序,确保它们与安卓系统的兼容性。在应用首次运行时,系统会根据连接的硬件设备自动触发intent。:确保你的安卓设备支持USB On-The-Go(OTG)。大多数现代手机都支持这一功能,但为了保险起见,可以在购买前确认或通过测试应用检测。请将 YOUR_VID 和 YOUR_PID 替换为你的串口设备的实际VID和PID。启动Android Studio,创建一个新的Android项目。通过添加以下依赖项到你的。
2025-03-03 16:34:54
841
原创 Faster R-CNN 算法详解
深度特征网络(Backbone Network):用于提取图像的高层次特征,比如 VGG 或 ResNet。区域建议网络(RPN,Region Proposal Network):用于生成候选区域(RoIs)。Fast R-CNN 检测器:对每个 RoI 进行类别分类和边界盒回归。特征提取区域建议生成分类和回归Faster R-CNN作为一代经典的目标检测框架,其核心创新在于将区域建议生成与深度特征网络紧密融合,加快训练速度并显著降低计算复杂度。
2025-03-03 08:38:09
439
原创 SSD目标检测
上述代码示例中使用PyTorch框架,易于理解和验证,实验结果可以在公开数据集上进行评估,如PASCAL VOC或COCO数据集,以检验模型性能。定义数据集加载器,实现数据增强策略,如随机裁剪、翻转等。实现非极大值抑制,定义评估指标如mAP,并提供测试代码。配置数据加载器,定义优化器和损失函数,并实现训练循环。定义SSD模型的结构,包括特征提取网络和预测器。c) 数据加载与训练循环。a) 数据加载与预处理。
2025-03-02 09:35:47
27
原创 基于机器学习的图像分类综述
基于深度学习的图像分类技术在过去几年取得了长足进步,并在多个领域(如计算机视觉、医学影像分析等)得到了广泛应用。然而,随着应用场景的复杂化,如何进一步提升模型性能、降低计算成本并增强泛化能力仍需更多的研究与创新。
2025-03-02 09:24:45
170
原创 python接入串口数据
时可能会出现异常,例如设备脱离或参数配置错误。确保用 try-except块来捕获这些异常。: 使用适当的缓冲区或超时机制,以确保不会有太多数据积累而被忽略。方法会阻塞直到有数据可用。: Default 情况下,
2025-02-26 14:55:58
557
原创 232、485、422串口的对比
此外,当为新系统选择接口时,考虑现有的硬件库(如USB转RS-485适配器)和相关设备的兼容性也至关重要。适用于需要多个设备协同工作的情况,如建筑物Automation、交通系统(如红绿灯控制)、工业过程监控和自动化生产线。常见于数据终端设备、测量仪器、工业控制系统等领域,例如远程监控站点与中心控制室的数据连接,或是高速和精密度要求较高的自动化环境中。:常见于台式电脑、打印机等设备的连接,尤其在短距离通信中广泛使用,如仪器控制和工业自动化中的简单设备接口。
2025-02-26 11:05:54
770
原创 物联网串口综述
串口(Serial Port)是一种用于设备之间传输数据的接口,其特点是以一条信号线依次传输数据位,因此它是一种“serial”通信方式。
2025-02-26 11:00:37
837
原创 聚类分析介绍
算法数据分布簇数明确性噪声处理计算效率K均值圆形、密度较高需要指定不适合高效层次聚类层次结构或簇数未知可选中等较低DBSCAN任意形状,具有密度差异未指定适合一般通过对各类聚类方法的比较与实际应用案例,当项目面临不同类型的数据挑战时,可以选择合适的算法并优化其性能。
2025-02-25 11:50:42
27
原创 车牌检测识别流程
车牌识别系统通过摄像头拍摄车辆图像,然后利用图像处理和机器学习技术来自动识别车牌号码。这一系统在停车场管理、交通监控、电子收费等领域有广泛的应用。
2025-02-25 11:46:38
341
原创 车牌检测与识别技术综述
随着智能交通系统的快速发展,车牌检测与识别技术在交通管理、电子收费、停车管理等领域发挥了重要作用。近年来,基于深度学习和计算机视觉的技术不断进步,使得车牌检测与识别的准确率和鲁棒性显著提升。本文从基础理论、关键技术、应用场景到未来挑战进行全面综述,并分析了当前研究热点与发展趋势。
2025-02-25 11:35:16
169
原创 Siamese网络
Siamese算法,通常也称为“孪生网络”(Siamese Network),是一种在计算机视觉和深度学习领域中广泛应用的算法。它主要用于处理需要比较两组输入数据相似性或差异性的任务,如人脸验证、图像匹配、文本相似度评估等。
2025-02-25 11:01:18
821
原创 基于Siamese网络的人脸识别
通过建立基于Siamese网络的人脸识别模型,可以有效改善传统分类模型在小样本情况下的表现,提供更具区分力的特征表示。然而,在实际应用中还需考虑数据配对的合理性、网络结构的选择等多个因素,确保模型能够适应不同场景的需求。此外,Siamese网络与其他深度学习技术(如GANs、Triple Loss等)结合使用,可以进一步提升人脸识别的准确性和稳定性,为未来的相关研究和发展提供了广阔的可能性。
2025-02-25 09:29:46
278
原创 基于YOLOv5的人脸检测实现
以下是基于YOLOv5实现人脸检测的详细步骤及代码实现,包含从数据准备到模型部署的全流程: 一、环境配置。3. 混合精度训练:在训练时添加`--half`参数启用FP16。1. 多线程预处理:使用生产者-消费者模式分离数据加载与推理。4. 模型蒸馏:使用大模型指导小模型训练提升小模型精度。1. 在models/yolo.py中添加HAM模块。2. 批处理推理:累积多帧后批量处理提升GPU利用率。2. 配置文件yolov5s-face.yaml。1. 数据配置文件face.yaml。3. 动态数据增强实现。
2025-02-24 17:09:26
158
原创 ubuntu离线安装ollama
如果发现有缺失的软件包,可以在有网络连接的情况下下载这些_missing_packages.deb文件,放在与Ollama相同的目录下。如果在安装过程中出现依赖性错误,可能出现`dpkg`未满足的依赖项。此时,需要再次检查遗漏的软件包,并下载其对应的.deb文件进行安装。在安装前,需要确保系统已满足所有依赖项。通过以上步骤,在Ubuntu离线环境下成功安装并运行Ollama是完全可行的。遇到依赖问题时,可能需要按顺序安装,确保较低级别的软件包先被安装。根据列出的依赖项,逐一检查并下载相应的.deb文件。
2025-02-21 14:13:38
1136
原创 通信系统中物理层与网络层联系与区别
在通信系统中,物理层和网络层**是OSI(开放系统互连)模型中的两个重要层次,分别位于协议栈的最底层和第三层。它们在功能、职责和实现方式上有显著的区别,但同时也在某些方面存在联系。尽管物理层和网络层在功能上有明显区别,但它们在通信系统中是紧密协作的,共同确保数据的可靠传输。在实际通信系统中,物理层和网络层的紧密协作是实现高效、可靠通信的关键。(1)物理层(Physical Layer)(2)网络层(Network Layer)3. 物理层与网络层的联系。(2)物联网(IoT)(1)数据传输的协作。
2025-02-21 09:22:05
795
原创 图像分类综述
图像分类是计算机视觉领域的核心任务之一,随着深度学习技术的发展,图像分类的准确率和效率得到了显著提升。未来,随着自监督学习、轻量化模型、多模态融合等技术的发展,图像分类将在更多领域得到广泛应用,并进一步提升其性能和可解释性。图像分类(Image Classification)是计算机视觉领域的基础任务之一,其目标是将输入的图像分配到一个预定义的类别中。随着深度学习技术的发展,图像分类的准确率和效率得到了显著提升。以下是图像分类的综述,涵盖其基本概念、关键技术、经典模型、应用场景、挑战及未来发展方向。
2025-02-20 08:58:50
182
原创 端边云架构
端边云架构是一种分布式计算架构,它将计算任务分布在终端设备、边缘节点和云端服务器之间,以实现高效的数据处理和资源管理。这种架构在现代物联网(IoT)、智能城市、工业互联网等场景中得到了广泛应用。端边云架构通过合理分配计算任务,优化资源利用,提高了系统的整体效率和响应速度,是未来智能化应用的重要支撑架构。
2025-02-20 08:51:54
621
原创 基于yolov5的人脸检测实现
以下是基于YOLOv5实现人脸检测的详细步骤及代码实现,包含从数据准备到模型部署的全流程: 一、环境配置。1. 在models/yolo.py中添加HAM模块。2. 配置文件yolov5s-face.yaml。2. 数据标注转换(Python实现)1. 导出TorchScript格式。1. 数据配置文件face.yaml。2. TensorRT加速部署。3. TensorRT推理示例。3. 动态数据增强实现。
2025-02-19 14:41:56
126
原创 基于机器学习的人脸识别方法探讨
通过卷积神经网络、人脸嵌入、损失函数优化等技术,人脸识别的准确率和效率得到了显著提升。然而,人脸识别仍然面临数据多样性、隐私安全、计算资源等多方面的挑战。未来,随着多模态融合、轻量化模型、隐私保护等技术的发展,人脸识别将在更多领域得到广泛应用,并进一步提升其性能和安全性。机器学习在人脸识别领域的应用是计算机视觉中最成功的案例之一。以下是机器学习在人脸识别中的应用、关键技术、流程及挑战的详细说明。通过对训练数据进行增强(如旋转、缩放、裁剪、添加噪声等),提高模型的泛化能力。4. 机器学习在人脸识别中的挑战。
2025-02-19 13:33:58
424
原创 人脸识别综述
人脸识别技术在过去几十年中取得了显著进展,尤其是深度学习技术的引入,极大地提升了识别的准确性和鲁棒性。未来,随着多模态融合、轻量化模型、隐私保护等技术的发展,人脸识别将在更多领域得到广泛应用,并进一步提升其性能和安全性。其核心任务是通过分析人脸图像或视频,提取独特的特征信息,并与数据库中的已知人脸进行比对,从而实现身份验证或识别。以下是人脸识别技术的综述,涵盖其基本概念、关键技术、应用场景、挑战及未来发展方向。① 卷积神经网络(CNN):CNN是当前人脸识别的主流方法,能够自动学习人脸的高层次特征。
2025-02-19 11:56:42
471
原创 AlexNet图像分类算法
AlexNet 是一个经典的卷积神经网络(CNN)架构,由 Alex Krizhevsky 等人在 2012 年提出,并在 ImageNet 图像分类竞赛中取得了突破性的成绩。AlexNet 的成功标志着深度学习在计算机视觉领域的崛起。以上展示了如何使用 PyTorch 实现 AlexNet 模型,并在 CIFAR-10 数据集上进行训练和测试。下面是一个使用 PyTorch 实现 AlexNet 进行图像分类的示例代码。我们将使用 CIFAR-10 数据集进行训练和测试。8. 加载模型并进行预测。
2025-02-19 10:47:27
367
原创 DenseNet图像分类算法
DenseNet(Densely Connected Convolutional Networks)是一种用于图像分类的深度学习模型,由Gao Huang等人在2017年提出。DenseNet通过密集连接的方式,使得每一层都直接连接到所有后续层,从而增强了特征传播和重用,减少了参数数量,并提高了模型的性能。实际实现时可以根据需要调整模型结构、数据集和超参数来适应不同的任务。PyTorch的`torchvision.models`模块中已经提供了预定义的DenseNet模型。7. 加载模型并进行推理。
2025-02-19 10:32:43
22
原创 ResNet图像分类
ResNet(Residual Network)是一种非常流行的深度学习模型,特别适用于图像分类任务。ResNet通过引入“残差连接”(residual connections)解决了深层网络中的梯度消失问题,使得训练非常深的神经网络成为可能。我们可以使用TorchVision中预定义的ResNet模型,也可以自己定义一个简单的ResNet模型。以上展示了如何使用PyTorch实现ResNet模型进行CIFAR-10图像分类任务。如果你有GPU,建议将模型和数据移动到GPU上进行训练,以加速训练过程。
2025-02-19 10:21:56
131
原创 GoogleNet图像分类算法
GoogleNet 的 Inception 模块通过多尺度特征提取提高了模型的表达能力,适合处理复杂的图像分类任务。可以根据需要调整模型结构或超参数,以适应不同的任务和数据集。GoogleNet(也称为 Inception v1)是由 Google 团队提出的一种深度卷积神经网络架构,以其高效的 Inception 模块和多层分类器著称。GoogleNet 的核心是 Inception 模块,它通过并行使用不同大小的卷积核来提取多尺度特征。3. 定义 GoogleNet 模型。4. 数据预处理和加载。
2025-02-19 10:00:18
20
原创 VGGNet 图像分类实现
VGGNet 是一种经典的卷积神经网络 (CNN) 架构,由牛津大学的 Visual Geometry Group 提出。VGGNet 以其简单的结构和深度著称,通常由多个卷积层和池化层堆叠而成。以下是使用 PyTorch 实现 VGGNet 进行图像分类的步骤。VGGNet 的结构简单但非常有效,适合作为深度学习入门的学习模型。可以根据需要调整模型结构或超参数,以适应不同的任务和数据集。VGGNet 有多个变体(如 VGG11、VGG16、VGG19),这里我们实现一个简单的 VGG16 模型。
2025-02-19 09:51:21
20
原创 Vision Transformer图像分类实现
Vision Transformer (ViT) 是一种基于 Transformer 架构的图像分类模型。与传统的卷积神经网络 (CNN) 不同,ViT 将图像分割成多个小块(patches),并将这些小块视为序列输入到 Transformer 中。以下是使用 PyTorch 实现 Vision Transformer 进行图像分类的步骤。在实际应用中可以根据需要调整模型的超参数,如 `embed_dim`、`depth`、`n_heads` 等,以适应不同的任务和数据集。4. 数据预处理和加载。
2025-02-19 09:29:22
342
原创 调用开源模型实现OCR识别
这些服务通常提供免费试用或按量计费的方式。3. 示例:调用百度 OCR API。2. 开源 OCR 工具**1. 使用 OCR 服务。
2025-02-18 11:00:57
486
原创 OCR识别
OCR(光学字符识别,Optical Character Recognition)的流程通常包括以下几个步骤。4. 字符分割(Character Segmentation)5.字符识别(Character Recognition)3. 文本检测(Text Detection)6. 后处理(Post-Processing)示例:OCR 识别流程的代码实现。
2025-02-18 10:14:12
314
原创 通义千问大模型接口改写文章
如果你无法直接调用通义千问 API,可以考虑使用阿里云的 DashScope 平台(通义千问的开放平台),通过 HTTP 请求调用 API。以下是 DashScope 的示例:DashScope API 示例。通过以上方法,你可以轻松调用通义千问 API 实现文章改写!3. 调用通义千问 API 实现文章改写。2. 安装阿里云 Python SDK。
2025-02-17 14:49:36
453
原创 同花顺数据爬取并生成K线
要使用Python爬取同花顺股票数据并生成K线图,你可以按照以下步骤进行。我们将使用`requests`库来获取数据,`pandas`来处理数据,`matplotlib`来绘制K线图。以下是一个简单的示例,假设你已经找到了一个可以获取股票数据的API。使用`mplfinance`库来生成K线图。`mplfinance`是专门用于绘制金融图表的库,支持K线图、成交量图等。如果你无法通过API获取数据,可以考虑使用`selenium`模拟浏览器操作来获取数据,但这通常会更复杂且效率较低。
2025-02-17 08:38:07
1124
原创 K线生成流程
在Python中,你可以使用 `matplotlib` 和 `mplfinance` 库来绘制股票的K线图(蜡烛图)。`mplfinance` 是一个专门用于绘制金融图表的库,它基于 `matplotlib`,并且提供了简单易用的接口来绘制K线图。你可以参考 `mplfinance` 的官方文档了解更多高级用法:[mplfinance 文档](https://github.com/matplotlib/mplfinance)首先,确保你已经安装了 `mplfinance` 和 `pandas` 库。
2025-02-14 10:36:09
321
原创 A股数据获取
爬取A股数据通常涉及从金融网站或API获取股票市场数据。以下是一个简单的Python示例,使用`requests`库和`BeautifulSoup`库从新浪财经爬取A股数据。如果你需要更复杂的数据分析,可以考虑使用`pandas`库来处理和分析数据,或者使用`matplotlib`库来绘制股票走势图。首先,确保你已经安装了`requests`和`BeautifulSoup`库。这些API通常需要注册并获取API密钥,具体使用方法可以参考各自的文档。
2025-02-14 10:32:33
268
原创 股票自动化交易
股票自动化交易是指通过编写程序自动执行股票买卖操作,以减少人为干预,提高交易效率和准确性。Python作为一种功能强大且易于上手的编程语言,广泛应用于金融领域,尤其是在量化交易和自动化交易中。本文使用Alpaca交易平台(支持模拟交易和实盘交易)来执行自动化交易。本文介绍了如何使用Python实现一个简单的股票自动化交易系统,包括数据获取、策略制定、信号生成、订单执行和风险管理。需要注意的是,自动化交易涉及金融风险,建议在实盘交易前充分测试策略,并严格遵守风险管理规则。在实际交易中,风险管理至关重要。
2025-02-13 18:02:27
907
原创 行人属性识别:从图像中提取行人特征
行人属性识别(Pedestrian Attribute Recognition, PAR)是计算机视觉领域的一个重要任务,旨在从图像或视频中识别出行人的各种属性,如性别、年龄、衣着、携带物品等。本文将介绍行人属性识别的基本概念,并通过一个简单的代码示例展示如何使用深度学习模型来实现这一任务。本文介绍了行人属性识别的基本概念,并通过一个简单的代码示例展示了如何使用深度学习模型来实现这一任务。3. 属性分类:最后,基于提取的特征,使用分类器来预测行人的属性。:包含100,000张图像,标注了26种行人属性。
2025-02-13 16:10:46
640
原创 也谈deepseek本地部署
如果你有更多需求(如自定义训练、模型微调等),可以深入研究 Hugging Face 的 `transformers` 库和 PyTorch 的高级功能。你可以使用 `transformers` 库直接加载模型。如果你希望将 DeepSeek 模型部署为一个 API 服务,可以使用 `Flask` 或 `FastAPI`。如果你的机器有 GPU,可以使用 PyTorch 的 GPU 支持来加速推理。如果你的机器有多个 GPU,可以使用 PyTorch 的分布式训练和推理功能。3.2 将模型移动到 GPU。
2025-02-11 18:16:02
527
VisionTransformer图像分类
2024-05-08
VGGNet图像分类算法
2024-05-08
GoogleNet图像分类算法
2024-05-08
pyqt+yolo+lprnet车牌检测识别系统
2024-05-06
ResNet图像分类算法
2024-05-06
DenseNet图像分类
2024-05-05
AlexNet图像分类
2024-05-04
图像视频的车牌检测系统
2024-04-26
目标检测数据集的扩充升级版
2024-04-11
目标检测数据集扩充程序
2023-12-04
基于深度学习的摔倒检测
2023-03-06
基于yolov5的猪体(pig)识别
2023-03-04
牛(cow)目标检测数据集
2023-03-04
牛(cow)数据集,VOC格式
2023-03-04
基于深度学习的钢筋端面识别
2023-03-04
yolov5牛体检测识别
2023-02-28
tkinter实现图像与视频中的人员统计
2023-02-27
前后端实现口罩检测与人脸识别
2023-02-19
python-flask-vue实现前后端人体与车辆属性检测
2023-02-18
基于yolov6的安全帽检测
2022-10-18
基于yolov5的安全帽检测
2022-10-18
keep_spider.py
2021-07-17
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人