自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 计算机组成原理知识点

本文系统介绍了计算机组成原理基础概念与技术要点。

2025-12-24 05:17:38 506 1

原创 计算机网络知识点

本文系统介绍了计算机网络基础概念与技术要点。

2025-12-08 19:28:51 938 3

原创 MMRotate--OpenMMLab(数据集配置+训练+测试+推理实现一体化) 旋转框检测工具箱与测试基准

本文介绍了旋转目标检测的基本概念和MMRotate框架。旋转目标检测通过增加旋转角度参数扩展了传统目标检测,适用于人脸识别、自动驾驶等多个领域。详细说明了MMRotate的安装步骤、数据集准备方法(特别是DOTA格式的处理)以及模型训练流程。以r3det模型为例,展示了从数据准备到模型训练、推理的全过程,包括配置文件修改、类别设置等关键步骤。最后演示了训练42轮后的推理效果,验证了该方法的有效性。文章提供了完整的实践指南和相关资源链接。

2025-12-08 15:15:58 1679

原创 MMagic--OpenMMLab 新一代人工智能内容生成(AIGC)工具箱

MMagic是一个开源AIGC工具箱,专为AI研究人员和工程师设计,支持图像和视频的生成、编辑与处理。它集成了先进的预训练模型,包括GANs、扩散模型等,适用于图文生成、图像修复、视频处理等多种任务。MMagic提供灵活的定制开发功能,用户可轻松训练新模型。安装方法可参考相关技术博客。该工具为生成式AI研究提供了强大支持。

2025-12-07 10:45:31 262

原创 MMOCR--OpenMMLab(数据集配置+训练+测试+推理实现一体化) 全流程文字检测识别理解工具包

MMOCR是一个基于PyTorch的开源OCR工具箱,支持文本检测、识别和关键信息提取任务。本文详细介绍了其安装方法、官方文档资源,以及使用ICDAR2015数据集训练DBNetPP模型的全流程,包括数据准备、配置修改、可视化检查、模型训练和测试评估。通过调整训练参数和数据集路径,用户可以快速上手并获得不错的检测效果(测试hmean达0.7556)。文章还提供了结果可视化方法,帮助用户直观理解模型输出,并鼓励用户根据需求自定义模型配置。

2025-12-07 00:01:17 676

原创 手把手教你安装MMOCR--OpenMMLab 全流程文字检测识别理解工具箱

本文详细的介绍了如何安装MMOCR,以及会遇到的报错问题和解决方案,相信一定会对你有所帮助。

2025-12-06 12:47:48 304

原创 MMPose--OpenMMLab(数据集配置+训练+测试+推理实现一体化) --姿态估计工具箱

MMPose是基于PyTorch的开源姿态估计工具箱,属于OpenMMLab项目,支持多种2D姿态估计任务。其模块化设计包含数据处理、模型构建、训练评估等组件,采用COCO数据集格式并支持自动加载元信息。本文以RTMPose模型为例,详细介绍了从数据准备、模型训练到测试推理的全流程,展示了在256x192输入尺寸下仅需2.3GB显存即可取得优异效果。实验结果表明,训练50轮后在COCO验证集上达到较高精度,并提供了完整的检测-姿态估计联合推理方案。该工具链配置灵活,适合开发者快速实现各类姿态估计应用。

2025-12-06 03:29:04 799

原创 手把手教你如何使用OpenDataLab下载数据集

OpenDataLab是一个提供高质量开放数据集的平台,特别服务于中国大模型语料数据联盟。本文以PASCAL_VOC2012数据集为例,介绍其下载方法。该数据集包含20个类别的物体识别任务,如人物、动物、交通工具等,每个图像都配有边界框和类别标签。下载方式有两种:一是官网直接勾选文件下载,二是使用CLI命令行工具下载(需提供AK/SK密钥)。平台官网地址为https://opendatalab.com/。

2025-12-05 20:44:20 271

原创 MMDetection(数据集配置+训练+推理实现一体化)--OpenMMLab 目标检测工具箱

MMDetection是一个开源目标检测工具箱,提供丰富的检测、分割算法和模块化组件。本文介绍了MMDetection框架结构(包含7个主要模块)、官方资源获取方式,并详细讲解了数据集准备流程:1)数据集目录结构规范;2)VOC2012数据集下载;3)数据集划分脚本使用;4)XML转COCO格式转换方法。最后演示了YOLOX模型的训练配置修改和启动命令,包括常见环境问题解决方案。通过继承配置文件可灵活调整模型结构,适用于不同检测任务。

2025-12-05 20:13:10 1561

原创 MMSegmentation--OpenMMLab 语义分割工具箱

本文介绍了使用mmsegmentation框架进行图像分割训练的完整流程。主要包括:1) 获取官方代码和文档;2) 准备数据集,详细说明了COCOStuff10k和PascalVOC2012数据集的下载、格式转换和路径配置方法;3) 模型训练,以PSPNet和DeepLabV3+为例,演示了配置文件修改、预训练权重加载和训练启动过程。文章还提供了自定义数据集训练的指导,强调数据集格式要求和配置文件继承机制。训练结果将保存在work_dirs目录中。

2025-12-04 17:07:01 1276

原创 KNN(我女朋友最喜欢的算法)从原理到实战(K - 近邻算法)--手动实现+附上全部代码

本文介绍了k近邻(KNN)算法的基本原理与实现。KNN是一种基于实例的懒惰学习算法,通过计算输入样本与训练数据的距离,选取k个最近邻进行多数表决分类。文章详细解析了KNN的三要素:距离度量(常用欧氏距离)、k值选择(需权衡误差)和分类决策规则(多数表决)。通过Python代码实现了KNN算法,包括距离计算、模型训练(仅存储数据)和预测过程。实验使用Iris数据集,采用分层抽样划分训练/测试集,最终展示了算法的分类效果。全文涵盖了从理论到实践的完整KNN实现流程。

2025-12-04 14:37:49 423 1

原创 决策树--手写ID3算法+CART算法(附全部代码),实现对离散值和连续值的双处理

本文实现了一个决策树分类器,支持ID3、C4.5和CART算法。通过计算信息熵或基尼系数选择最优划分特征,处理离散和连续特征,实现递归树构建。代码包含预剪枝控制(最大深度、最小样本数等)、特征选择策略和纯度度量标准。测试显示在贷款数据集和数值数据集上均取得良好效果,准确率较高。核心功能包括:计算信息熵/基尼系数、特征划分、树构建和预测。该实现完整展示了决策树的核心算法流程,包括特征选择、树生成和预测等关键步骤。

2025-12-03 09:07:36 614

原创 Linear Regression-附上全部代码(线性回归+过拟合处理)--机器学习最基础的算法

本文探讨了线性回归与最小二乘法的原理及实现。通过构建多项式模型拟合带噪声的正弦函数数据,采用梯度下降法最小化损失函数(残差平方和)。实验发现高阶多项式(100阶)会出现过拟合现象,表现为训练误差小而预测能力差。为解决此问题,引入L2正则化项(岭回归),通过惩罚权重参数的大小有效控制了过拟合。文中提供了完整的Python实现代码,包含数据生成、多项式拟合、梯度下降优化和正则化处理等关键步骤,并对比了正则化前后的拟合效果。结果表明,正则化虽然略微增加了损失值,但显著提升了模型的泛化能力。

2025-12-03 04:05:48 955

原创 PCA(主成分分析)--机器学习中经典的无监督降维算法

本次实验通过手动实现PCA算法并将其应用于鸢尾花数据集,深入理解了主成分分析的工作原理和实现细节。通过代码,利用降维后的二维数据进行KNN分类并可视化决策边界,直观展示了PCA在数据可视化和特征提取方面的优势。

2025-12-02 23:07:25 325

原创 MMTracking--基于 PyTorch 的开源视频目标跟踪工具箱

本文介绍了基于MMTracking框架的DeepSORT多目标跟踪实现方法。首先提供了官方代码和文档链接,并详细说明了MOT17数据集的下载与格式转换步骤(转换为COCO和ReID格式)。重点解析了DeepSORT在MMTracking中的实现架构,指出该框架不支持端到端训练,需分别训练检测器(如Faster R-CNN)和ReID模型。文章给出了具体的训练命令和配置文件修改方法,并演示了如何使用训练好的模型进行视频推理测试,包括权重替换和可视化输出等关键步骤。最后强调用户可根据需求训练不同模型并替换权重实

2025-12-02 01:06:56 1054

原创 DeepSort---目标追踪-原理讲解

DeepSort算法是一种基于检测的多目标跟踪算法,其核心流程包括:1)初始化Tracks并预测目标位置;2)通过IOU匹配和匈牙利算法关联检测框与预测框;3)处理匹配结果(更新匹配的Tracks、删除失配Tracks或初始化新Tracks);4)对确认态Tracks进行级联匹配,结合外观特征和运动信息提高匹配准确性;5)循环执行上述步骤直至视频结束。该算法使用卡尔曼滤波预测目标运动轨迹,并通过独立的reid模型训练提取目标外观特征,最终实现鲁棒的多目标跟踪。

2025-12-01 17:23:07 591

原创 常见问题解决

本文记录了在WSL中配置Ubuntu环境及解决深度学习框架安装问题的过程。

2025-12-01 12:45:59 336 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除