ViviAnwen_xz-优快云博客

原创计算机组成原理知识点

本文系统介绍了计算机组成原理基础概念与技术要点。

2025-12-24 05:17:38 506 1

原创计算机网络知识点

本文系统介绍了计算机网络基础概念与技术要点。

2025-12-08 19:28:51 938 3

原创 MMRotate--OpenMMLab(数据集配置+训练+测试+推理实现一体化) 旋转框检测工具箱与测试基准

本文介绍了旋转目标检测的基本概念和MMRotate框架。旋转目标检测通过增加旋转角度参数扩展了传统目标检测，适用于人脸识别、自动驾驶等多个领域。详细说明了MMRotate的安装步骤、数据集准备方法（特别是DOTA格式的处理）以及模型训练流程。以r3det模型为例，展示了从数据准备到模型训练、推理的全过程，包括配置文件修改、类别设置等关键步骤。最后演示了训练42轮后的推理效果，验证了该方法的有效性。文章提供了完整的实践指南和相关资源链接。

2025-12-08 15:15:58 1679

原创 MMagic--OpenMMLab 新一代人工智能内容生成（AIGC）工具箱

MMagic是一个开源AIGC工具箱，专为AI研究人员和工程师设计，支持图像和视频的生成、编辑与处理。它集成了先进的预训练模型，包括GANs、扩散模型等，适用于图文生成、图像修复、视频处理等多种任务。MMagic提供灵活的定制开发功能，用户可轻松训练新模型。安装方法可参考相关技术博客。该工具为生成式AI研究提供了强大支持。

2025-12-07 10:45:31 262

原创 MMOCR--OpenMMLab(数据集配置+训练+测试+推理实现一体化) 全流程文字检测识别理解工具包

MMOCR是一个基于PyTorch的开源OCR工具箱，支持文本检测、识别和关键信息提取任务。本文详细介绍了其安装方法、官方文档资源，以及使用ICDAR2015数据集训练DBNetPP模型的全流程，包括数据准备、配置修改、可视化检查、模型训练和测试评估。通过调整训练参数和数据集路径，用户可以快速上手并获得不错的检测效果（测试hmean达0.7556）。文章还提供了结果可视化方法，帮助用户直观理解模型输出，并鼓励用户根据需求自定义模型配置。

2025-12-07 00:01:17 676

原创手把手教你安装MMOCR--OpenMMLab 全流程文字检测识别理解工具箱

本文详细的介绍了如何安装MMOCR,以及会遇到的报错问题和解决方案，相信一定会对你有所帮助。

2025-12-06 12:47:48 304

原创 MMPose--OpenMMLab(数据集配置+训练+测试+推理实现一体化) --姿态估计工具箱

MMPose是基于PyTorch的开源姿态估计工具箱，属于OpenMMLab项目，支持多种2D姿态估计任务。其模块化设计包含数据处理、模型构建、训练评估等组件，采用COCO数据集格式并支持自动加载元信息。本文以RTMPose模型为例，详细介绍了从数据准备、模型训练到测试推理的全流程，展示了在256x192输入尺寸下仅需2.3GB显存即可取得优异效果。实验结果表明，训练50轮后在COCO验证集上达到较高精度，并提供了完整的检测-姿态估计联合推理方案。该工具链配置灵活，适合开发者快速实现各类姿态估计应用。

2025-12-06 03:29:04 799

原创手把手教你如何使用OpenDataLab下载数据集

OpenDataLab是一个提供高质量开放数据集的平台，特别服务于中国大模型语料数据联盟。本文以PASCAL_VOC2012数据集为例，介绍其下载方法。该数据集包含20个类别的物体识别任务，如人物、动物、交通工具等，每个图像都配有边界框和类别标签。下载方式有两种：一是官网直接勾选文件下载，二是使用CLI命令行工具下载（需提供AK/SK密钥）。平台官网地址为https://opendatalab.com/。

2025-12-05 20:44:20 271

原创 MMDetection（数据集配置+训练+推理实现一体化）--OpenMMLab 目标检测工具箱

MMDetection是一个开源目标检测工具箱，提供丰富的检测、分割算法和模块化组件。本文介绍了MMDetection框架结构（包含7个主要模块）、官方资源获取方式，并详细讲解了数据集准备流程：1）数据集目录结构规范；2）VOC2012数据集下载；3）数据集划分脚本使用；4）XML转COCO格式转换方法。最后演示了YOLOX模型的训练配置修改和启动命令，包括常见环境问题解决方案。通过继承配置文件可灵活调整模型结构，适用于不同检测任务。

2025-12-05 20:13:10 1561

原创 MMSegmentation--OpenMMLab 语义分割工具箱

本文介绍了使用mmsegmentation框架进行图像分割训练的完整流程。主要包括：1) 获取官方代码和文档；2) 准备数据集，详细说明了COCOStuff10k和PascalVOC2012数据集的下载、格式转换和路径配置方法；3) 模型训练，以PSPNet和DeepLabV3+为例，演示了配置文件修改、预训练权重加载和训练启动过程。文章还提供了自定义数据集训练的指导，强调数据集格式要求和配置文件继承机制。训练结果将保存在work_dirs目录中。

2025-12-04 17:07:01 1276

原创 KNN（我女朋友最喜欢的算法）从原理到实战（K - 近邻算法）--手动实现+附上全部代码

本文介绍了k近邻（KNN）算法的基本原理与实现。KNN是一种基于实例的懒惰学习算法，通过计算输入样本与训练数据的距离，选取k个最近邻进行多数表决分类。文章详细解析了KNN的三要素：距离度量（常用欧氏距离）、k值选择（需权衡误差）和分类决策规则（多数表决）。通过Python代码实现了KNN算法，包括距离计算、模型训练（仅存储数据）和预测过程。实验使用Iris数据集，采用分层抽样划分训练/测试集，最终展示了算法的分类效果。全文涵盖了从理论到实践的完整KNN实现流程。

2025-12-04 14:37:49 423 1

原创决策树--手写ID3算法+CART算法（附全部代码），实现对离散值和连续值的双处理

本文实现了一个决策树分类器，支持ID3、C4.5和CART算法。通过计算信息熵或基尼系数选择最优划分特征，处理离散和连续特征，实现递归树构建。代码包含预剪枝控制（最大深度、最小样本数等）、特征选择策略和纯度度量标准。测试显示在贷款数据集和数值数据集上均取得良好效果，准确率较高。核心功能包括：计算信息熵/基尼系数、特征划分、树构建和预测。该实现完整展示了决策树的核心算法流程，包括特征选择、树生成和预测等关键步骤。

2025-12-03 09:07:36 614

原创 Linear Regression-附上全部代码（线性回归+过拟合处理）--机器学习最基础的算法

本文探讨了线性回归与最小二乘法的原理及实现。通过构建多项式模型拟合带噪声的正弦函数数据，采用梯度下降法最小化损失函数（残差平方和）。实验发现高阶多项式（100阶）会出现过拟合现象，表现为训练误差小而预测能力差。为解决此问题，引入L2正则化项（岭回归），通过惩罚权重参数的大小有效控制了过拟合。文中提供了完整的Python实现代码，包含数据生成、多项式拟合、梯度下降优化和正则化处理等关键步骤，并对比了正则化前后的拟合效果。结果表明，正则化虽然略微增加了损失值，但显著提升了模型的泛化能力。

2025-12-03 04:05:48 955

原创 PCA（主成分分析）--机器学习中经典的无监督降维算法

本次实验通过手动实现PCA算法并将其应用于鸢尾花数据集，深入理解了主成分分析的工作原理和实现细节。通过代码，利用降维后的二维数据进行KNN分类并可视化决策边界，直观展示了PCA在数据可视化和特征提取方面的优势。

2025-12-02 23:07:25 325

原创 MMTracking--基于 PyTorch 的开源视频目标跟踪工具箱

本文介绍了基于MMTracking框架的DeepSORT多目标跟踪实现方法。首先提供了官方代码和文档链接，并详细说明了MOT17数据集的下载与格式转换步骤（转换为COCO和ReID格式）。重点解析了DeepSORT在MMTracking中的实现架构，指出该框架不支持端到端训练，需分别训练检测器（如Faster R-CNN）和ReID模型。文章给出了具体的训练命令和配置文件修改方法，并演示了如何使用训练好的模型进行视频推理测试，包括权重替换和可视化输出等关键步骤。最后强调用户可根据需求训练不同模型并替换权重实

2025-12-02 01:06:56 1054

原创 DeepSort---目标追踪-原理讲解

DeepSort算法是一种基于检测的多目标跟踪算法，其核心流程包括：1）初始化Tracks并预测目标位置；2）通过IOU匹配和匈牙利算法关联检测框与预测框；3）处理匹配结果（更新匹配的Tracks、删除失配Tracks或初始化新Tracks）；4）对确认态Tracks进行级联匹配，结合外观特征和运动信息提高匹配准确性；5）循环执行上述步骤直至视频结束。该算法使用卡尔曼滤波预测目标运动轨迹，并通过独立的reid模型训练提取目标外观特征，最终实现鲁棒的多目标跟踪。

2025-12-01 17:23:07 591

原创常见问题解决

本文记录了在WSL中配置Ubuntu环境及解决深度学习框架安装问题的过程。

2025-12-01 12:45:59 336 1

2301_80426691的博客