- 博客(114)
- 收藏
- 关注
原创 yolov13结合ARConv:有效涨点创新设计
本文介绍了自适应矩形卷积(ARConv)模块在YOLOv13中的集成方法。主要内容包括:1)在tasks.py中修改基础函数以传递epoch参数;2)实现ARConv模块的核心代码;3)注册新模块并配置模型yaml文件;4)执行训练脚本的注意事项。ARConv通过动态调整卷积核形状(3×3到7×7)来提升特征提取能力,在训练过程中会根据epoch数自适应调整。文章提供了完整的实现代码链接,并展示了训练结果。该模块相比传统卷积能更好地适应不同尺度的特征,同时保持了即插即用的特性。
2025-09-28 16:06:48
1117
原创 YOLO26技术深度解析:边缘端部署革命与工程迁移指南
摘要:YOLO26通过端到端架构重构,采用无NMS设计、移除DFL损失及引入MuSGD优化器,实现CPU推理速度提升43%。核心创新包括双标签分配策略直接输出有序检测框,ProgLoss平衡回归精度,以及MuSGD优化器加速训练。边缘设备实测显示,YOLO26-nano在树莓派5B上延迟降低至24.3ms,内存占用减少20%。部署时推荐静态ONNX格式,避免动态
2025-09-28 14:13:44
1323
原创 YOLO多机多GPU训练环境
本文介绍了YOLO模型多机分布式训练的配置方法。硬件需要多台带GPU的电脑(建议同型号)和千兆网络;软件要求安装相同版本的Python、PyTorch、YOLO代码和NCCL库。步骤包括:1)在所有电脑安装基础软件;2)配置SSH免密登录;3)主电脑启动训练,其他电脑加入。关键注意事项:所有电脑需能访问相同数据集、网络稳定、软件版本一致、学习率需调整。训练时需验证GPU工作状态、损失下降和批量大小是否正确。该方法适合初学者搭建多机训练环境。
2025-09-28 10:28:03
212
原创 自适应矩形卷积(ARConv):突破传统卷积限制的创新设计
摘要:CVPR2025提出的自适应矩形卷积(ARConv)突破传统卷积核固定形状限制,通过动态学习卷积核高度和宽度实现多尺度特征提取。该技术采用双分支网络预测最优卷积核尺寸,结合矩形形变和双线性插值,在遥感图像处理中显著提升多尺度目标适应性。相比可变形卷积,ARConv仅需学习2个参数,计算效率提升30%以上。在遥感图像融合任务中,SAM指标降低至2.885,Q8提升至0.921。ARConv为计算机视觉提供了一种计算高效、内存优化的自适应特征提取新范式。
2025-09-24 10:50:25
930
原创 YOLOv13 中DSC3k2与Context Guided (CGNet)的融合与创新
本文提出了一种融合DSC3k2模块与ContextGuided(CG)块的轻量化目标检测网络改进方案。通过引入CG块的上下文感知机制,在减少10.8%参数量的同时,mAP50指标提升1个百分点至0.985,实现了计算效率与检测精度的双重优化。改进后的模型在参数量(2.19M)和计算量(5.9GFLOPs)显著降低的情况下,保持608层网络深度,更适合移动端部署。该方案通过深度可分离卷积与上下文特征融合的协同设计,为轻量级网络架构提供了新思路。
2025-09-22 15:36:20
747
原创 超详细的Git使用教程:从入门到精通
Git是一款分布式版本控制系统,由Linus Torvalds为管理Linux内核开发而创建。相比SVN等集中式系统,Git具有本地完整代码库、强大的分支管理、离线工作等优势。其核心工作流程包括克隆、修改、暂存、提交和推送等步骤。通过GitHub、Gitee等平台可实现代码托管和团队协作。常用命令涵盖仓库管理、分支操作、标签管理等,并支持解决冲突和版本回滚。最佳实践建议采用分支开发、定期提交、编写清晰提交信息等规范。掌握Git对开发者至关重要,能有效提升代码管理效率和团队协作能力,需通过持续实践来熟练掌握。
2025-09-17 10:53:28
674
原创 YOLOv8 PTQ与QAT量化实战:从理论到源码详解
本文深入探讨了YOLOv8模型的两种量化技术:训练后量化(PTQ)和量化感知训练(QAT)。首先从量化数学原理出发,介绍了对称/非对称量化、量化粒度等核心概念,并分析了量化误差来源。随后详细讲解了环境配置和PTQ实现方法,包括模型校准、性能测试等关键步骤,提供了完整的Python代码实现。文中还介绍了自适应量化算法选择等高级优化技巧,帮助开发者在资源受限设备上实现模型压缩与加速的最佳平衡。通过理论分析与实践指导相结合,为读者提供了从原理到落地的完整量化解决方案。
2025-09-17 09:23:23
211
原创 YOLOv8(旋转目标检测)RK3588部署
模型是YOLOV8中的一个变体, 专门设计用于检测具有方向的边界框(Oriented Bounding Boxes,OBB),相比传统的水平矩形边界框(Horizontal Bounding Boxes,HBB), OBB模型能够更准确地识别有角度或旋转的物体,适用于航空影像、文本检测等领域。YOLOv8-OBB模型是在数据集上训练。DOTAv1数据集有15个类别,总共有2800多张图像,图像分辨率从800*800到20000*20000不等。
2025-09-01 15:30:41
819
原创 RK3588部署YOLOv8姿态估计
在当前目录的install/rk3588_linux中,还有一个yolov8_pose_videocapture_demo,可以打开摄像头或者视频文件,下面测试打开摄像头,并拍摄其他屏幕显示的画面。后处理,根据设置的置信度阈值BOX_THRESH,对检测框进行筛选,然后对符合要求的检测框进行解码,并进行nms,解码关键点,还原到原图尺度等。# 执行例程请注意摄像头的设备号,支持的分辨率,编解码格式等等,具体请查看yolov8_pose_videocapture_demo.cc源文件。
2025-09-01 15:25:08
1136
原创 RK3588部署YOLOv8分割
其他参数,source指定要预测的图片路径或者视频等等,imgsz指定图像尺寸等等,更多参数具体参考下:https://docs.ultralytics.com/usage/cfg/# 模型保存在对应目录下(../runs/segment/train/weights/best.onnx),为了便于识别,可以重新命名为yolov8n-seg.onnx。导出的onnx模型,还需要通过toolkit2转换成rknn模型,这里简单编译下模型转换程序将onnx模型转换成rknn模型。
2025-09-01 15:23:21
1099
原创 RK3588部署yolov8目标检测
建立在以前YOLO版本的成功基础上, 引入了新的功能和改进,进一步提高了性能和灵活性。YOLOv8设计快速、准确且易于使用,是目标检测和跟踪、实例分割、图像分类和姿态估计任务的绝佳选择。有5个不同模型大小的预训练模型:n、s、m、l和x。不同大小模型目标检测的准确度:本章将简单测试以及模型,并在鲁班猫板卡上部署测试。提示测试环境:板卡系统是Debian11,PC是WSL2(ubuntu20.04),rknn-Toolkit2是1.6.0以上版本。
2025-09-01 15:19:17
1178
原创 突破算力极限!订阅《YOLOv5极致优化实战》专栏,解锁低算力设备实时推理黑科技
《YOLOv5极致优化实战》专栏破解边缘计算部署难题,在4核消费级CPU上实现182.4FPS突破。通过剪枝、量化感知、稀疏化等核心技术,模型体积缩减75%的同时保持mAP损失<3%。专栏提供完整代码和工业级解决方案,包含树莓派4B适配、ONNX导出避坑等独家内容,实测某安防企业部署成本降低90%至9200元/年。适用于需在老旧x86/ARM设备部署的开发者,现订阅即获工程代码库、部署套件等资源,开启CPU性能革命。
2025-07-23 14:25:34
500
原创 YOLOv5模型压缩进阶技巧与实用经验
本文系统总结了YOLOv5模型压缩的进阶技巧与实战经验。重点介绍了剪枝+量化联合优化方案,包括recipe设计、实操命令和典型实验结果分析;探讨了迁移学习与模型压缩的结合实践;详细讲解了多模型部署与性能调优方法,包括ONNX导出、REST API部署等;提供了实验结果可视化分析与常见问题排查技巧。文章强调采用联合recipe、迁移学习结合压缩、批量自动化部署等实用策略,并推荐使用notebook、Wandb等工具进行实验记录与对比,为YOLOv5模型优化提供了全面的工程实践指导。
2025-07-23 14:13:46
338
原创 YOLOv5 DeepSparse高效推理与性能测试实战教程
本教程详细讲解如何使用DeepSparse引擎高效推理YOLOv5模型,涵盖annotate.py和benchmark.py两个核心脚本的实操应用。内容包含DeepSparse推理原理、参数配置详解、性能测试方法、加速优化技巧以及常见问题排查。教程特别针对剪枝/量化模型优化,提供多后端对比、批量推理、可视化分析等实用功能,帮助开发者实现CPU环境下的高效目标检测。附有详细命令示例、参数说明和结果分析方法,适合已掌握YOLOv5训练的开发者进阶优化推理性能。
2025-07-23 14:04:37
204
原创 YOLOv5模型导出与ONNX转换实战教程
摘要:本文详细讲解YOLOv5模型导出与ONNX转换实战方法,包括导出原理、命令参数解析、源码解读、推理加速、REST API部署等核心内容。重点介绍了ONNX导出命令、动态shape处理、剪枝/量化模型导出技巧,以及使用DeepSparse/ONNX Runtime进行高效推理的实现步骤。文章还提供了常见问题排查指南和实用优化技巧,帮助开发者快速掌握YOLOv5模型转换与部署的关键技术,适用于多种推理引擎和硬件平台。
2025-07-23 13:49:24
564
原创 YOLOv5激活函数替换与模型变体实验实战教程
激活函数是深度神经网络中非线性建模的关键组件。ReLU:简单高效,广泛应用于各类网络。:表现优于ReLU,YOLOv5默认激活函数。Hardswish:近似Swish但计算更高效,适合移动端和稀疏推理。等:新型激活函数,部分场景下有更优表现。不同激活函数对模型的收敛速度、最终精度、推理效率均有影响。
2025-07-23 13:43:17
447
原创 YOLOv5模型量化训练实战教程
本文详细介绍了YOLOv5模型量化训练实战方法,重点讲解如何利用SparseML进行量化感知训练(QAT)。内容包括量化原理、SparseML量化机制与recipe参数配置、量化训练命令实操、源码解读、模型评估与推理加速技巧,以及常见问题排查。教程提供了纯量化和剪枝+量化联合两种训练方案,通过YAML文件定义量化策略,并给出具体训练命令示例。同时介绍了量化后模型的导出与DeepSparse推理优化方法,最后总结了精度下降等常见问题的解决方案。
2025-07-23 13:39:41
515
原创 YOLOv5模型剪枝实战教程
《YOLOv5模型剪枝实战指南》系统介绍了基于SparseML的YOLOv5剪枝技术。文章首先阐述剪枝原理,区分非结构化与结构化剪枝方法;重点解析SparseML的recipe文件配置,包括学习率调度、稀疏率参数设置和分层剪枝策略;详细说明训练命令参数和源码集成逻辑;提供效果评估方法及常见问题解决方案;最后指出进阶方向包括结合量化和迁移学习。本教程注重实操性,配套项目文件可直接运行,帮助开发者快速掌握YOLOv5模型压缩技巧。
2025-07-23 13:33:07
639
原创 格灵深瞳视觉算法面试30问全景精解
摘要 本文系统梳理了格灵深瞳(GREATVISION)视觉算法岗位面试的核心考点,精选30个典型问题,涵盖视频分析、异常检测、智能交通、行人重识别等关键领域。内容聚焦计算机视觉算法在安防、零售、交通等场景的实际应用,包括多目标跟踪、异常行为检测、车流量统计、行人重识别、视频目标检测、客流分析、模型压缩、遮挡处理、车牌识别等核心技术。每个问题均提供算法原理说明、数学公式表达、Python代码实现及工程应用分析,重点考察候选人在复杂场景下的算法创新能力和工程落地经验。通过结构化的问题解析,帮助面试者全面掌握视觉
2025-07-23 00:19:39
757
原创 商汤科技视觉算法面试30问全景精解
本文系统梳理了商汤科技视觉算法面试的30个核心问题,涵盖多任务感知、人脸识别、目标检测、行为识别、模型压缩等关键技术领域。内容聚焦计算机视觉在智慧城市、安防监控等产业场景的应用,深入解析了FPN、3D卷积、对比学习等前沿算法的原理与实现。每个问题均提供理论公式说明、代码示例(如ArcFace、多任务网络等)及商汤实际应用场景,帮助面试者掌握视觉算法在产业落地的关键能力。特别强调多尺度建模、表征学习和轻量化部署等商汤重点考察方向,为AI视觉算法岗位求职提供全面指导。
2025-07-23 00:09:23
545
原创 旷视科技视觉算法面试30问全景精解
本文精选旷视科技视觉算法岗位面试中的30个核心问题,系统梳理了计算机视觉领域的关键技术与工程实践。内容涵盖人脸识别、目标检测、图像分割、行为识别等方向,重点解析了多任务网络设计、对比学习、特征检索、模型压缩等前沿技术。文章通过数学公式、代码示例和工程应用三方面深入讲解每个问题,包括ArcFace损失函数、FPN特征融合、3D卷积时序建模等核心技术原理及其在智能安防、工业检测等场景的实际应用。为视觉算法工程师提供了从理论到实践的全面面试指导,特别适合应聘旷视科技等AI企业的技术岗位候选人参考学习。
2025-07-23 00:06:36
788
原创 得物视觉算法面试30问全景精解
摘要: 本文系统解析得物视觉算法面试核心考点,聚焦商品图像理解、鉴别防伪两大技术方向。精选多任务网络设计、对比学习、图像检索、多尺度检测、分割算法、小样本学习、自监督学习、模型轻量化、时序建模等9大典型问题,提供技术原理、数学表达、代码实现与工程应用的完整解答方案。内容涵盖从基础理论到业务落地的全链路能力要求,特别强调得物在商品鉴别、瑕疵检测、特征检索等特色场景的创新实践,为求职者提供全面的技术准备框架。
2025-07-23 00:04:20
1598
原创 大疆视觉算法面试30问全景精解
本文系统梳理了大疆视觉算法面试的30个核心问题,涵盖多任务感知网络设计、端到端自主飞行系统、视觉SLAM、目标检测跟踪、模型轻量化、时序建模、点云处理和多传感器融合等关键技术。针对每个问题,提供了算法原理、数学公式、代码实现和工程应用解析,如多任务网络损失函数设计、端到端一体化网络架构、ORB-SLAM特征提取、目标跟踪的检测-ReID融合、深度可分离卷积优化等。通过这些典型问题,全面展现了大疆在无人机视觉算法领域的技术重点和工程实践要求,为相关岗位求职者提供系统的面试准备框架。
2025-07-23 00:01:41
949
原创 蔚来汽车视觉算法面试30问全景精解
蔚来汽车视觉算法面试核心要点摘要 本文系统梳理了蔚来汽车视觉算法岗位面试的8大核心考点,涵盖多任务感知网络设计、端到端一体化系统、视觉SLAM定位、车道线检测、多尺度特征融合、模型轻量化、时序建模、点云处理等关键技术方向。每个问题从原理公式、代码实现到工程应用三个维度展开,突出自动驾驶场景下的算法创新与落地能力。内容聚焦智能电动汽车特有的视觉算法挑战,如多传感器融合、实时性保障、安全冗余设计等,为应聘者提供从理论到实践的全面指导,帮助把握蔚来对算法工程化能力的高标准要求。
2025-07-22 23:59:04
730
原创 小鹏汽车视觉算法面试30问全景精解
本文系统梳理了小鹏汽车视觉算法面试的30个核心问题,涵盖自动驾驶感知、视觉算法创新和工程落地三大方向。重点解析了多任务感知网络、端到端一体化系统、视觉SLAM、车道线检测、多尺度特征融合等关键技术,涉及深度学习模型设计、3D重建、时序建模和点云处理等前沿领域。每个问题从考察点、技术原理、代码实现到工程应用四个维度展开,突出了小鹏汽车对算法创新与产业落地的双重重视。文章为智能驾驶领域的算法工程师提供了全面的面试准备指南,特别强调算法在自动驾驶场景下的鲁棒性优化和系统集成能力,体现了小鹏汽车"AI驱动
2025-07-22 23:53:03
1016
原创 哔哩哔哩视觉算法面试30问全景精解
本文系统梳理了B站视觉算法面试的核心考点,涵盖7大技术方向:1)弹幕OCR与内容审核技术,详解EAST+CRNN+CTC的完整解决方案;2)视频多标签分类与标签生成,重点分析多标签损失函数设计;3)智能推荐中的多模态融合技术,包括注意力机制与对比学习;4)视频审核目标检测算法,介绍YOLO系列等模型应用;5)虚拟主播的核心人脸识别与表情驱动技术;6)视频分割与实例分割算法;7)推荐系统中的自监督与对比学习。每个问题均包含技术原理、数学公式、代码实现和B站实际应用场景,突出算法在二次元视频社区的工程落地能力。
2025-07-22 23:46:38
906
原创 小红书视觉算法面试30问全景精解
小红书视觉算法面试聚焦内容理解、商品识别、多模态推荐等核心场景,考察算法在社区生态中的落地能力。本文精选30题,涵盖图像检索、多标签分类、多模态融合、目标检测、人脸分析、实例分割和对比学习等关键技术,提供理论解析与代码示例。面试重点考察候选人对视觉基础理论的掌握程度,以及在复杂社区场景中将算法转化为实际业务价值的能力,如商品图像检索的对比学习、多模态推荐的特征融合、内容审核的目标检测等。这些技术广泛应用于小红书的推荐系统、内容理解和安全审核等核心业务场景。
2025-07-22 23:45:56
649
原创 微博视觉算法面试30问全景精解
摘要 本文系统梳理了微博视觉算法岗位面试的核心考察点,精选30个典型问题,涵盖内容审核、实时美颜、多标签分类、目标检测、人脸识别、视频分割、多模态融合、时序建模等关键技术。每个问题从算法原理、数学表达、代码实现到工程应用四个维度进行深度解析,突出社交媒体场景下视觉算法的特殊挑战与解决方案。内容聚焦微博等社交平台特有的海量数据处理、实时性要求、跨模态理解等实际问题,为应聘者提供从理论到实践的完整指导框架,助力在算法面试中展现扎实的技术功底和解决实际业务问题的能力。
2025-07-22 23:39:03
423
原创 快手视觉算法面试30问全景精解
本文系统整理了快手视觉算法岗位面试中的30个核心问题,覆盖短视频、实时推荐、视觉创新等关键领域。问题涵盖实时美颜、多标签分类、多模态融合、目标检测、人脸识别、视频分割、自监督学习、时序建模等算法方向,每个问题均提供技术解析、原理公式、示例代码及应用场景说明。这些内容全面考察候选人在视觉算法领域的理论深度、工程实践和创新能力,适合准备短视频平台视觉算法岗位的求职者参考学习,帮助掌握快手等一线大厂视觉算法面试的核心考点和技术要求。
2025-07-22 23:36:46
927
原创 小米视觉算法面试30问全景精解
本文精选小米视觉算法岗位面试中的9个典型问题,涵盖手机影像、智能家居、机器人等核心应用场景。问题包括超分辨率重建、目标检测、端云协同、夜景降噪、人脸识别、视觉SLAM、模型量化、HDR成像和行为识别等关键技术点。每个问题从考察要点、原理解析、代码实现和工程应用四个维度进行深入剖析,展现小米视觉算法在智能终端与物联网领域的创新实践。通过这些问题,全面考察候选人的理论基础、工程能力和产业落地思维,助力在面试中展现小米生态所需的视觉算法综合能力。
2025-07-22 23:32:13
750
原创 网易视觉算法面试30问全景精解
摘要 本文系统梳理了网易视觉算法岗位面试的30个核心问题,全面覆盖游戏视觉、智能娱乐、内容审核、教育智能化等业务场景的关键技术。从实时检测分割、人脸表情分析、多模态融合到3D重建点云处理,问题设计兼顾理论深度与工程实践,突出网易在内容生态与智能娱乐领域的算法创新。每个问题提供原理公式、代码示例和落地应用说明,帮助候选人掌握网易视觉算法的考察重点。面试既考察传统CV基础,也关注多模态理解、小样本学习等前沿方向,以及算法在网易云音乐、游戏等产品中的工程优化能力,全面评估候选人的技术广度和产业落地思维。
2025-07-22 23:27:15
431
原创 拼多多视觉算法面试30问全景精解
本文系统梳理了拼多多视觉算法岗位面试的30个核心问题,涵盖商品图像分类、以图搜图、多标签分类、多模态融合、属性识别、数据增强、视觉Transformer、自监督学习等关键技术。每个问题提供详细解答、数学原理、代码实现及工程应用场景,突出拼多多在智能零售领域的算法创新与落地能力。文章聚焦大规模商品识别、极致性价比、复杂供应链等业务场景,帮助候选人全面掌握视觉算法在电商平台的应用要点,提升面试竞争力。
2025-07-22 23:20:43
747
原创 美团视觉算法面试30问全景精解
摘要 美团视觉算法面试30问全景精解涵盖了智能配送、餐饮识别、城市感知等核心场景的关键技术。文章针对目标检测与路径规划、多标签分类、实例分割、时序建模、优化调度、小样本学习、多模态融合等七大方向,深入剖析了美团业务场景下的算法应用: 智能配送系统:结合YOLOv5和A*算法实现目标检测与最优路径规划 餐饮识别技术:采用多标签损失和注意力机制提升菜品分类精度 城市视觉感知:通过Mask R-CNN实现实例分割和场景理解 智能门店分析:LSTM+Transformer建模人流量统计和行为识别 配送优化调度:遗传
2025-07-22 23:15:07
815
原创 京东视觉算法面试30问全景精解
京东视觉算法面试聚焦零售与工业场景的AI落地能力,涵盖商品检索、仓储检测、属性识别、缺陷检测等核心问题。文章系统梳理了30个典型面试问题及解答方案,包括商品图像检索的ANN算法与对比学习、智能仓储中的YOLOv5+DeepSORT检测跟踪框架、多任务属性识别模型设计、供应链场景的Mask R-CNN分割应用、工业质检的无监督异常检测方法等关键技术。每个问题提供理论推导、代码实现和京东实际应用案例,突显算法在亿级商品管理、智能物流、自动化质检等业务中的工程转化价值,为候选人应对大厂视觉算法面试提供全方位指导。
2025-07-22 23:08:21
473
原创 字节跳动视觉算法面试30问全景精解
本文系统梳理了字节跳动视觉算法岗位面试的核心考察点,精选30个典型问题,涵盖实时视频美颜、短视频内容理解、直播人像分割、视频时序建模、表情识别、视觉Transformer、3D人脸重建等前沿技术方向。每个问题分析包含技术原理、数学表达、代码实现及工程应用场景,突出字节跳动作为全球内容科技公司在算法创新与规模落地方面的独特要求。文章为视觉算法工程师提供了从基础理论到产业实践的全面面试准备指南,尤其强调多模态融合、实时处理、大规模内容理解等与字节跳动业务高度相关的技术能力。
2025-07-22 23:01:35
491
原创 华为视觉算法面试30问全景精解
以上30个问题涵盖了华为视觉算法岗位面试的核心知识点,建议结合项目经验深入理解,祝大家面试顺利,早日拿到心仪offer!
2025-07-22 22:57:36
683
原创 阿里巴巴视觉算法面试30问全景精解
本文系统梳理了阿里巴巴视觉算法岗位的30个核心面试问题,涵盖图像风格迁移、多尺度特征融合、文本检测识别、视觉Transformer和3D点云检测等关键技术。文章不仅深入解析了算法原理(如Gatys风格迁移公式、FPN特征融合、CRNN模型结构等),还提供了工程实现代码示例(如PyTorch实现的MultiHeadSelfAttention模块)。重点突出了阿里在电商、物流等业务场景中的实际应用,如商品图美化、物流单据OCR等,体现了对算法创新与工程落地能力的双重考察。全文兼顾理论深度与实践指导价值,为应聘者
2025-07-22 22:54:57
901
原创 百度视觉算法岗位30问及详解
以上30个问题涵盖了百度视觉算法岗位面试的核心知识点,建议结合项目经验深入理解,祝大家面试顺利,早日拿到心仪offer!
2025-07-22 00:27:23
899
原创 腾讯视觉算法岗位30问及详解
以上30个问题涵盖了腾讯视觉算法岗位面试的核心知识点,建议结合项目经验深入理解,祝大家面试顺利,早日拿到心仪offer!
2025-07-22 00:18:24
598
原创 海康威视视觉算法岗位30问及详解
卷积神经网络(Convolutional Neural Network, CNN)是一类专门用于处理具有类似网格结构数据(如图像、语音、视频等)的深度神经网络。CNN 的核心思想是通过卷积操作提取输入数据的局部特征,并通过多层堆叠实现从低级到高级的特征抽象。与传统的全连接神经网络相比,CNN 具有参数少、计算高效、泛化能力强等优点。原理说明:局部感受野(Local Receptive Field):每个神经元只与输入的一小块区域相连,能够捕捉局部特征。这样可以有效提取空间结构信息。
2025-07-21 23:22:13
1539
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅