- 博客(210)
- 资源 (5)
- 收藏
- 关注
原创 深度学习实战文档图像矫正
文档图像矫正技术致力于解决拍摄角度畸变、物理变形等问题,对提升OCR准确率和数字化效率至关重要。该技术经历了从传统图像处理(如霍夫变换)到深度学习的演进,当前主流方法包括关键点检测、网格变形和端到端矫正三种路线。深度学习模型如DocUNet、Transformer架构等显著提升了处理复杂变形文档的能力,
2025-06-19 21:50:49
1347
原创 前端框架vue3的变化之处
Vue 3.0 的主要变化包括:1) 创建应用实例改用 createApp 方法,避免全局配置影响;2) data 选项必须使用函数形式;3) 生命周期名称变更并新增渲染追踪钩子;4) 支持绑定多个事件处理函数;5) 新增 emits 选项声明自定义事件;6) 引入 v-is 指令取代部分 is 属性功能;7) 未声明属性和事件需手动继承;8) v-model 支持参数和多个绑定,并可自定义修饰符;9) 提供响应式的 provide/inject 功能。这些改进增强了组件灵活性、响应性和代码组织性。
2025-06-11 14:29:12
1478
原创 用ultralytics库训练YOLO模型训练中验证集Loss为NaN、mAP为0问题解决方案
YOLO训练遇到验证损失NaN问题的解决方案 在使用ultralytics库训练YOLO模型时,验证阶段出现损失值NaN但mAP50等指标仍能计算(有时为0)的问题。研究发现这与显卡的自动混合精度(AMP)功能有关。解决方法是在训练时关闭AMP功能,可通过以下任一方式实现: 在train()函数中设置amp=False参数 修改配置文件default.yaml添加amp: False 使用CLI命令时添加amp=False选项 关闭AMP后,模型训练过程中验证阶段的损失计算即可恢复正常。
2025-06-11 08:45:20
682
原创 UNet深度学习实战遥感图像语义分割
U-net是一种图像分割技术,主要用于遥感图像分割任务。这些特点使U-net在影像领域具有很高的实用性,并导致广泛采用U-net作为遥感成像中分割任务的主要工具。U-net在几乎所有主要的成像方式中都得到了广泛的应用,从CT扫描、MRI到X光检查和显微镜。此外,虽然U-net在很大程度上是一种细分工具,但也有一些例子U-net在其他应用中的使用。鉴于U-net的潜力仍在增长,这部叙事文学综述分析了U-net体系结构的众多发展和突破,并提供了对近期趋势的观察。
2025-04-14 23:39:23
1658
原创 UNet深度学习实战遥感航拍图像语义分割
U-net是一种图像分割技术,主要用于遥感航拍分割任务。这些特点使U-net在影像领域具有很高的实用性,并导致广泛采用U-net作为成像中分割任务的主要工具。U-net在几乎所有主要的成像方式中都得到了广泛的应用。此外,虽然U-net在很大程度上是一种细分工具,但也有一些例子U-net在其他应用中的使用。
2025-04-14 23:33:28
1655
1
原创 深度学习实战火焰与烟雾检测
本文采用YOLOv11作为核心算法框架,结合PyQt5构建用户界面,使用Python3进行开发。YOLOv11以其高效的实时检测能力,在多个目标检测任务中展现出卓越性能。本研究针对火焰与烟雾数据集进行训练和优化,该数据集包含丰富的火焰与烟雾图像样本,为模型的准确性和泛化能力提供了有力保障。通过深度学习技术,模型能够自动提取火焰与烟雾的特征并进行分类识别。PyQt5界面设计简洁直观,便于用户操作和实时查看检测结果。本研究不仅提高了火焰与烟雾识别的自动化水平,还为火焰与烟雾生产系统的构建提供了有力支持
2025-04-07 22:52:58
1256
原创 深度学习实战电力设备缺陷检测
本文采用YOLOv11作为核心算法框架,结合PyQt5构建用户界面,使用Python3进行开发。YOLOv11以其高效的实时检测能力,在多个目标检测任务中展现出卓越性能。本研究针对电力设备缺陷数据集进行训练和优化,该数据集包含丰富的电力设备缺陷图像样本,为模型的准确性和泛化能力提供了有力保障。通过深度学习技术,模型能够自动提取电力设备缺陷的特征并进行分类识别。PyQt5界面设计简洁直观,便于用户操作和实时查看检测结果。本研究不仅提高了电力设备缺陷识别的自动化水平,还为电力设备缺陷系统的构建提供了有力支持
2025-04-07 22:51:52
1557
原创 深度学习车牌关键点定位与矫正识别系统
深度学习关键点在车牌识别领域的研究背景源于计算机视觉和模式识别领域的发展。车牌识别是一种重要的图像处理任务,它在交通管理、安防监控、停车管理等领域具有广泛的应用价值。
2025-04-06 17:11:14
1444
原创 YOLOv11实战电力设备缺陷检测
本文采用YOLOv11作为核心算法框架,结合PyQt5构建用户界面,使用Python3进行开发。YOLOv11以其高效的实时检测能力,在多个目标检测任务中展现出卓越性能。本研究针对电力设备缺陷数据集进行训练和优化,该数据集包含丰富的电力设备缺陷图像样本,为模型的准确性和泛化能力提供了有力保障。通过深度学习技术,模型能够自动提取电力设备缺陷的特征并进行分类识别。PyQt5界面设计简洁直观,便于用户操作和实时查看检测结果。本研究不仅提高了电力设备缺陷识别的自动化水平,还为电力设备缺陷系统的构建提供了有力支持
2025-04-06 17:08:14
1439
原创 YOLOv11实战火焰与烟雾检测
本文采用YOLOv11作为核心算法框架,结合PyQt5构建用户界面,使用Python3进行开发。YOLOv11以其高效的实时检测能力,在多个目标检测任务中展现出卓越性能。本研究针对火焰与烟雾数据集进行训练和优化,该数据集包含丰富的火焰与烟雾图像样本,为模型的准确性和泛化能力提供了有力保障。通过深度学习技术,模型能够自动提取火焰与烟雾的特征并进行分类识别。PyQt5界面设计简洁直观,便于用户操作和实时查看检测结果。本研究不仅提高了火焰与烟雾识别的自动化水平,还为火焰与烟雾生产系统的构建提供了有力支持
2025-03-30 16:16:02
2284
原创 YOLO结合bytetrack对车辆目标跟踪计数
本文采用YOLOv8作为核心算法框架,结合PyQt5构建用户界面,使用Python3进行开发。YOLOv8以其高效的实时检测能力,在多个目标检测任务中展现出卓越性能。本研究针对车辆目标数据集进行训练和优化,该数据集包含丰富的车辆目标图像样本,为模型的准确性和泛化能力提供了有力保障。通过深度学习技术,模型能够自动提取车辆目标的特征并进行分类识别。PyQt5界面设计简洁直观,便于用户操作和实时查看检测结果。本研究不仅提高了车辆目标识别的水平,还为车辆目标保护提供了有力支持,具有重要的理论应用价值。
2025-03-11 22:26:09
1623
原创 深度卷积神经网络模型车道线检测
UFLD采用了一种简单而高效的架构,主要由骨干网络(Backbone)、特征融合层和分类头(Classification Head)三部分组成。骨干网络负责从输入图像中提取特征,特征融合层对提取的特征进行整合,分类头则根据融合后的特征进行车道线的分类预测。
2025-03-11 22:17:55
900
原创 深度学习实战车道线检测
UFLD采用了一种简单而高效的架构,主要由骨干网络(Backbone)、特征融合层和分类头(Classification Head)三部分组成。骨干网络负责从输入图像中提取特征,特征融合层对提取的特征进行整合,分类头则根据融合后的特征进行车道线的分类预测。
2025-03-09 18:39:03
1999
原创 深度学习实战车辆目标跟踪与计数
本文采用YOLOv8作为核心算法框架,结合PyQt5构建用户界面,使用Python3进行开发。YOLOv8以其高效的实时检测能力,在多个目标检测任务中展现出卓越性能。本研究针对车辆目标数据集进行训练和优化,该数据集包含丰富的车辆目标图像样本,为模型的准确性和泛化能力提供了有力保障。通过深度学习技术,模型能够自动提取车辆目标的特征并进行分类识别。PyQt5界面设计简洁直观,便于用户操作和实时查看检测结果。本研究不仅提高了车辆目标识别的水平,还为车辆目标保护提供了有力支持,具有重要的理论应用价值。
2025-03-09 13:00:31
2053
1
原创 YOLOv11车牌关键点定位与矫正识别系统
深度学习YOLOv11关键点在车牌识别领域的研究背景源于计算机视觉和模式识别领域的发展。车牌识别是一种重要的图像处理任务,它在交通管理、安防监控、停车管理等领域具有广泛的应用价值。传统的车牌识别方法往往依赖于手工设计的特征和规则,但这些方法在复杂场景下容易受到光照、遮挡、角度变化等因素的影响,导致识别率下降。
2025-03-02 22:06:52
1478
原创 MATLAB深度学习实战中国车牌识别
matlab深度学习在车牌识别领域的研究背景源于计算机视觉和模式识别领域的发展。车牌识别是一种重要的图像处理任务,它在交通管理、安防监控、停车管理等领域具有广泛的应用价值。
2025-02-28 22:10:31
1206
原创 深度学习行人跌倒识别系统
本文采用YOLOv11作为核心算法框架,结合PyQt5构建用户界面,使用Python3进行开发。YOLOv11以其高效的实时检测能力,在多个目标检测任务中展现出卓越性能。本研究针对行人跌倒数据集进行训练和优化,该数据集包含丰富的行人跌倒图像样本,为模型的准确性和泛化能力提供了有力保障。通过深度学习技术,模型能够自动提取行人跌倒的特征并进行分类识别。PyQt5界面设计简洁直观,便于用户操作和实时查看检测结果。本研究不仅提高了行人跌倒识别的自动化水平,还为行人跌倒保护系统的构建提供了有力支持,具有重要的理论应用
2025-02-28 22:09:03
1125
原创 深度学习电影推荐-文本卷积算法
随着互联网和流媒体平台的快速发展,用户可以随时访问海量的电影资源。然而,如何帮助用户在繁杂的选择中快速找到符合其兴趣的电影,成为了一个重要且具有挑战性的问题。推荐系统作为解决信息过载的重要工具,在电影行业得到了广泛应用。近年来,深度学习技术的崛起为推荐系统的构建提供了新的方法和更高的精度,其强大的特征提取能力和非线性建模能力使电影推荐系统更加智能化和个性化。
2025-02-24 21:05:27
902
原创 YOLOv8车牌关键点定位与矫正识别系统
深度学习yolov8关键点车牌定位技术的目标是从输入图像中准确地定位车牌的位置,通常是通过预测车牌的边界框或四个关键点的位置来实现。以下是一种常见的深度学习车牌定位技术原理,用于获取车牌的四个点位置:
2025-02-24 09:24:59
3090
原创 卷积神经网络实战宠物狗识别
本文采用卷积神经网络作为核心算法框架,结合PyQt5构建用户界面,使用Python3进行开发。YOLOv11以其高效的特征提取能力,在多个图像分类任务中展现出卓越性能。本研究针对5种宠物狗数据集进行训练和优化,该数据集包含丰富的宠物狗图像样本,为模型的准确性和泛化能力提供了有力保障。通过深度学习技术,模型能够自动提取宠物狗的特征并进行分类识别。PyQt5界面设计简洁直观,便于用户操作和实时查看检测结果。
2025-02-17 11:16:17
2143
原创 卷积神经网络实战TT100K中国交通标志识别
本文采用卷积神经网络作为核心算法框架,结合PyQt5构建用户界面,使用Python3进行开发。YOLOv11以其高效的实时检测能力,在多个目标检测任务中展现出卓越性能。本研究针对TT100K交通标志数据集进行训练和优化,该数据集包含丰富的TT100K交通标志图像样本,为模型的准确性和泛化能力提供了有力保障。通过深度学习技术,模型能够自动提取TT100K交通标志的特征并进行分类识别。PyQt5界面设计简洁直观,便于用户操作和实时查看检测结果。
2025-02-16 19:27:14
1128
原创 深度学习实战道路裂缝缺陷识别
本文采用YOLOv8作为核心算法框架,结合PyQt5构建用户界面,使用Python3进行开发。YOLOv8以其高效的实时检测能力,在多个目标检测任务中展现出卓越性能。本研究针对道路裂缝数据集进行训练和优化,该数据集包含丰富的道路裂缝图像样本,为模型的准确性和泛化能力提供了有力保障。通过深度学习技术,模型能够自动提取道路裂缝的特征并进行分类识别。PyQt5界面设计简洁直观,便于用户操作和实时查看检测结果
2025-02-16 19:25:10
1828
原创 深度学习实战多焦点图像融合
人们在用相机拍照时,由于相机景深问题,难以确保每个细节都清晰。相机不能将镜头内所有景物拍摄清楚,导致拍摄出的照片不能完全满足需求。为此,多焦点图像融合技术应运而生。它巧妙地将两张在同一取景地但聚焦位置不同的源图像融合,得到一张整体聚焦的融合图,从而巧妙地突破了传统技术景深限制,为摄影艺术带来新的可能性。这样的融合图像不仅更符合人类的视觉感知习惯,而且也便于后续的数字图像处理,提高了处理效率。此外,多聚焦图像融合技术还有助于提高图像的细节保留和清晰度,使得图像在视觉上更加美观,同时也能更好地满足各种计算分析的
2025-02-15 20:47:40
1041
原创 深度卷积神经网络实战行人目标跟踪
本文采用卷积神经网络作为核心算法框架,结合PyQt5构建用户界面,使用Python3进行开发。YOLOv8以其高效的实时检测能力,在多个目标检测任务中展现出卓越性能。本研究针对行人目标数据集进行训练和优化,该数据集包含丰富的行人目标图像样本,为模型的准确性和泛化能力提供了有力保障。通过深度学习技术,模型能够自动提取行人目标的特征并进行分类识别。PyQt5界面设计简洁直观,便于用户操作和实时查看检测结果。本研究不仅提高了行人目标识别的水平,还为行人目标保护提供了有力支持,具有重要的理论应用价值。
2025-02-14 21:16:45
1623
原创 DeepSeek-R1-Distill-Qwen-7B WebDemo 部署
DeepSeek-R1-Distill-Qwen-7B WebDemo 部署
2025-02-13 11:24:28
552
原创 深度卷积神经网络实战行人跌倒识别
本文采用深度卷积神经网络作为核心算法框架,结合PyQt5构建用户界面,使用Python3进行开发。YOLOv11以其高效的实时检测能力,在多个目标检测任务中展现出卓越性能。本研究针对行人跌倒数据集进行训练和优化,该数据集包含丰富的行人跌倒图像样本,为模型的准确性和泛化能力提供了有力保障。通过深度学习技术,模型能够自动提取行人跌倒的特征并进行分类识别。PyQt5界面设计简洁直观,便于用户操作和实时查看检测结果。本研究不仅提高了行人跌倒识别的自动化水平,还为行人跌倒保护系统的构建提供了有力支持,具有重要的理论应
2025-02-13 11:19:38
1210
原创 DeepSeek-R1-Distill-Qwen-7B FastApi 部署调用
DeepSeek-R1-Distill-Qwen-7B FastApi 部署调用
2025-02-11 13:28:34
823
1
原创 深度学习实战人脸表情识别
人脸表情识别是计算机视觉领域中的一个重要研究方向,它涉及到通过分析人脸图像中的面部表情来理解人的情感状态。这项技术具有广泛的研究背景和实际应用意义
2025-02-11 13:16:11
1099
原创 深度学习实战图像修复
图像缺陷修复是一种图像处理技术,其目标是根据图像内容的上下文信息,自动填补缺失或损坏的部分,使修复后的图像尽可能接近真实场景。缺陷修复广泛应用于图像编辑、文物修复、医学图像处理等领域。
2025-02-10 13:44:47
1793
原创 YOLOv11实战海洋动物图像识别
本文采用YOLOv11作为核心算法框架,结合PyQt5构建用户界面,使用Python3进行开发。YOLOv11以其高效的特征提取能力,在多个图像分类任务中展现出卓越性能。本研究针对5种海洋动物数据集进行训练和优化,该数据集包含丰富的海洋动物图像样本,为模型的准确性和泛化能力提供了有力保障。通过深度学习技术,模型能够自动提取海洋动物的特征并进行分类识别。PyQt5界面设计简洁直观,便于用户操作和实时查看检测结果。
2025-02-10 11:35:20
2241
原创 深度卷积神经网络实战海洋动物图像识别
本文采用深度卷积神经网络作为核心算法框架,结合PyQt5构建用户界面,使用Python3进行开发。YOLOv11以其高效的特征提取能力,在多个图像分类任务中展现出卓越性能。本研究针对5种海洋动物数据集进行训练和优化,该数据集包含丰富的海洋动物图像样本,为模型的准确性和泛化能力提供了有力保障。通过深度学习技术,模型能够自动提取海洋动物的特征并进行分类识别。PyQt5界面设计简洁直观,便于用户操作和实时查看检测结果。
2025-02-09 15:59:09
2318
原创 张量并行核心原理
与流水线并行不同,张量并行是将模型中的张量进行拆分然后分配到不同的 GPU 上,每块 GPU 都可以得到所有层张量的部分参数。这样在前向计算中有效减少了流水行并行中的空置时间,提高了 GPU 的显存利用率,因此张量并行也成了当下大模型训练和推理的主流并行方法。
2025-02-08 09:38:00
1799
原创 深度卷积神经网络实战复杂图像车牌识别
深度学习在车牌识别领域的研究背景源于计算机视觉和模式识别领域的发展。车牌识别是一种重要的图像处理任务,它在交通管理、安防监控、停车管理等领域具有广泛的应用价值。传统的车牌识别方法往往依赖于手工设计的特征和规则,但这些方法在复杂场景下容易受到光照、遮挡、角度变化等因素的影响,导致识别率下降。
2025-02-07 20:53:15
1606
原创 深度学习实战复杂场景下的车牌识别
深度学习在车牌识别领域的研究背景源于计算机视觉和模式识别领域的发展。车牌识别是一种重要的图像处理任务,它在交通管理、安防监控、停车管理等领域具有广泛的应用价值。传统的车牌识别方法往往依赖于手工设计的特征和规则,但这些方法在复杂场景下容易受到光照、遮挡、角度变化等因素的影响,导致识别率下降。
2025-02-07 19:34:55
1581
原创 深度卷积神经网络实战花卉图像识别
本文采用深度卷积神经网络作为核心算法框架,结合PyQt5构建用户界面,使用Python3进行开发。YOLOv11以其高效的特征提取能力,在多个图像分类任务中展现出卓越性能。本研究针对5种花卉数据集进行训练和优化,该数据集包含丰富的花卉图像样本,为模型的准确性和泛化能力提供了有力保障。通过深度学习技术,模型能够自动提取花卉的特征并进行分类识别。PyQt5界面设计简洁直观,便于用户操作和实时查看检测结果。
2025-02-06 11:31:51
1061
原创 浅谈DeepSeek为何成本如此低
大语言模型的性能与成本一直是业界关注的焦点,曾经业内的共识是训练大模型需要非常多的显卡,但DeepSeek-R1的出现打破了这一格局,DeepSeek在只用了OpenAI几十分之一的成本的情况下,训练出了能对标当时最先进的GPT-o1模型的DeepSeek-R1模型,DeepSeek不但训练成本显著低于OpenAI的模型。且每 100 万 tokens 的输入,R1 比 GPT-o1 模型便宜 90%,输出价格更是降低了 27 倍左右。DeepSeek-R1的发布大大降低了人们对大模型成本的预期
2025-02-06 11:27:28
1718
Mastering OpenCV 3 2nd Edition B01N7G0BKE
2018-01-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅