机器白学-优快云博客

原创【从零开始系列】Qwen2.5-VL：通义千问最新发布的多模态大模型！——环境配置 + 多功能使用实验（图片识别理解、目标检测、文字OCR、文档解析、视频理解）

Qwen-VL多模态大模型的安装使用，附大量实验图片

2025-02-11 16:39:11 8639 19

原创【从零开始系列】DeepSeek-R1：（本地部署使用）思维链推理大模型，开源的神！——Windows / Linux本地环境测试 + vLLM / SGLang远程部署服务

本地部署deepseek的环境安装、模型下载、代码使用、vLLM或SGLang部署教程

2025-02-07 11:20:16 4620

原创【从零开始使用系列】StyleGAN2：开源图像生成网络——环境搭建与基础使用篇（附大量测试图）

StyleGAN 英伟达团队开源的高质量图片生成器模型的环境搭建和基础使用教程

2025-01-13 15:47:04 1767

原创【从零开始系列】Qwen2.5 & Llama-Factory：开源语言大模型+训练平台——（超详细、最新版）一篇文章解决：环境搭建 =＞微调训练 =＞本地部署

使用llama-factory大语言模型微调高效平台，对qwen2.5官方预训练模型进行微调并部署

2025-01-13 15:46:40 4694

原创从壹开始解读Yolov11【源码研读系列】——文章目录索引

解析yolo源码逻辑并实验相关功能类，源码解析博文目录索引部分

2024-12-09 13:53:58 2055 8

原创【从零开始系列】GOT-OCR2.0——多模态通用型OCR（非常具有潜力的开源OCR项目）：项目环境安装配置 + 测试使用

本文是多模态通用型OCR模型的环境安装和测试部分

2024-11-15 17:44:55 4688 11

原创【论文精读】GOT-OCR2.0源码论文——打破传统OCR流程的多模态视觉-语言大模型架构：预训练VitDet 视觉模型+ 阿里通义千问Qwen语言模型

2024年9月GOT-OCR2.0项目源码论文解读：一种挑战传统OCR流程，能在多模态大模型基础上，针对不同OCR任务便捷微调的通用性OCR模型架构论文

2024-11-14 15:34:23 2617

原创从零开始使用Surya-OCR最新版本0.6.1——最强文本检测模型：新添表单表格检测识别

surya最新版本的使用教程

2024-10-24 10:32:23 4952 16

原创【从零开始系列】最新版Paddle（PaddleOCR系列）——第一部分：文本检测和识别模型的环境安装与基础使用

本篇记录最新Paddle的OCR系列环境配置和基本的使用方式

2024-10-14 14:01:32 4343

原创【强化学习系列】Gym库使用——创建自己的强化学习环境2：拆解官方标准模型源码/规范自定义类+打包自定义环境

本文记录在创建自定义gym环境中的报错与规范化问题，帮助后续矢量化环境创建

2024-09-18 11:34:52 2412

原创从零开始使用YOLOv8【Debug解析源码系列】——第一部分：YOLO模型加载流程解构+Detection模型网络层torch加载解析

本文详细拆解了ultralytics——yolov8加载检测模型的代码逻辑，为将自定义的模型接入ultralytics平台进行部署或训练铺路

2024-08-27 15:59:12 3476 8

原创【从零开始系列】YOLOv8和v11（最新版本使用环境已更新）——环境配置与极简指令（CLI）操作：1篇文章解决—直接使用：模型部署 and 自建数据集：训练微调

本篇介绍yolov8官方的安装流程以及安装中一些报错的解决，并根据官方文档的命令行指令，实现yolov8模型的基本使用以及自建数据集微调训练

2024-07-29 14:33:43 6676 2

原创从零开始使用YOLO和Paddle——模型CPU部署

文本目标检测任务中，部署yolo和paddle模型到cpu设备上的流程

2024-04-17 14:39:51 4222 1

原创【从零开始系列】Surya-OCR版本0.3.0——文本目标检测模型的安装与部署

本文完整详细记录了从安装到调试到部署一个开源Github文本检测项目的全过程

2024-04-15 15:10:48 11035 33

原创机器学习数学原理专题——广义线性模型数学公式总览

广义线性模型章节内容总览

2024-02-24 21:26:49 1029

原创【论文翻译】DeepSeek-V3论文翻译——DeepSeek-V3 Technical Report——第二部分：（训练硬件）基础设施

Deepseek论文技术报告第二部分：训练硬件的基础设施设计

2025-02-11 22:32:14 1165

原创【论文翻译】DeepSeek-V3论文翻译——DeepSeek-V3 Technical Report——第一部分：引言与模型架构

Deepseek技术报告翻译第一部分：模型架构

2025-02-07 22:55:55 3692 1

原创【Python Tips】多线程池加速独立运行程序——ThreadPoolExecutor

多线程池加速独立运行程序——ThreadPoolExecutor

2025-01-07 11:15:54 262

原创从壹开始解读Yolov11【源码研读系列】——核心源码部分：Engine.validator.py：BaseValidator——模型验证基类：验证流程+多框多阈值匹配算法

验证器基类最关键的两个部分就是：1.定义了验证数据加载、数据前处理、推理、后处理等的标准验证流程；2.定义预测框匹配算法，用于统计“类别正确，框与真实框近似重叠”的预测。

2025-01-07 10:32:53 1463 3

原创从壹开始解读Yolov11【源码研读系列】——核心源码部分：Engine.model.py.Model类：统一模型加载和功能（训练、验证、预测...）的基类

engine目录下model.py文件中的Model类——一个统一加载模型和使用模型训练、预测、验证已经网络层等操作的基类

2024-12-09 13:51:53 1985 2

原创【Python Tips】可视化大批量移动文件——os、shutil和tqdm

使用os、shutil和tqdm实现大规模数据移动和过程可视化

2024-12-02 16:07:12 274

原创从零开始使用GOT-OCR2.0——多模态OCR项目：微调数据集构建 + 训练（解决训练报错，成功实验微调训练）

本文记录GOT-OCR解码器（语言模型）进行微调训练的全过程，解决了训练过程中的报错，完成了从搭建数据集到最终训练的全过程测试。

2024-12-02 11:08:42 3480 2

原创从零开始使用YOLOv8和v11——Linux系统使用指令部署大规模训练记录

YOLO在Linux环境下如何部署训练

2024-11-21 16:29:36 1967

翻译【论文翻译】ViTDet论文翻译——Exploring Plain Vision Transformer Backbones for Object Detection

ViTDet论文原文翻译

2024-11-19 22:41:36 164

原创从壹开始解读Yolov11【源码研读系列】——Data.build.py：YOLO用于训练Train + 验证Val的无限数据集加载器DataLoader搭建

本文记录YOLO搭建其训练和验证使用的数据集加载器的Build.py文件

2024-11-18 16:08:59 1707

翻译【论文翻译】GOT-OCR论文翻译——General OCR Theory: Towards OCR-2.0 via a Unified End-to-end Model

GOT-OCR论文翻译

2024-11-18 11:18:15 405

原创【Python Tips】Python内置函数isinstance——检测数据类型：处理多种类型的输入参数（对比type）

isinstance：python内置函数检测数据格式类型

2024-11-12 22:35:48 439

原创从零开始使用YOLOv11——Yolo检测detect数据集自建格式转换为模型训练格式：20w+图片&1w+类别代码测试成功

本文记录YOLO检测模型训练数据集搭建过程和代码

2024-11-12 15:02:10 2001

原创【Python Tips】多个条件判断——一种更加简洁清晰的写法

python条件判断

2024-11-08 16:26:30 1029

原创从壹开始解读Yolov11【源码研读系列】——Data.dataset.py：模型训练数据预处理/YOLO官方数据集类——YOLODataset

本文解读data目录下的YOLODataset数据集类，其读取并预处理YOLO数据集中的标签和图片信息，是训练必不可少的部分

2024-11-08 16:22:48 2418

原创从壹开始解读Yolov11【源码研读系列】——Data.Augment.py：数据增强模块第四部分——Format图片+标签Pytorch格式化

YOLO源码数据增强augment.py中关于标签数据标准化，以及将所有数据转pytorch的类介绍

2024-10-30 16:15:36 1189

原创【Python Tips】列表去重——列表list数据预处理：嵌套列表去重

列表嵌套元素去重

2024-10-29 17:35:02 814

原创从壹开始解读Yolov11【源码研读系列】——Data.Base.py：可灵活改写的数据集加载处理基类——BaseDataset

本文解读YOLO源码data文件下的base.py文件中的BaseDataset类，这个类提供了一个可以灵活调整的数据集加载基类

2024-10-29 15:42:54 1437

原创从壹开始解读Yolov11【源码研读系列】——Data.Augment.py：数据增强模块第三部分——LetterBox图片形状格式化：模型预测和训练前图片必须的预处理操作

本文单独记录yolo数据增强augment源码中的LetterBox类，因为其是模型网络接收数据前必须做的图片预处理，将图片形状转化到模型可以接收的大小。

2024-10-25 16:56:36 1276

原创从壹开始解读Yolov11【源码研读系列】——Data.Augment.py：数据增强模块第二部分——图片随机变化

本文介绍yolo源码数据增强部分中的随机图片变化类。相关测试代码地址：https://gitee.com/machine-bai-xue/yolo-source-code-experiment

2024-10-25 13:58:17 1491

原创从壹开始解读Yolov11【源码研读系列】——Data.Augment.py：数据增强模块第一部分——图片组合变化

本文主要解读了yolo源码数据处理子文件data中augment数据增强模块的部分数据增强类，并实验其具体效果

2024-10-23 15:46:04 2246 5

原创【Python Tips】读取地址最后的文件名——split、os、pathlib库函数使用

本文记录如何取出地址最后的文件名，推荐使用os或pathlib模块

2024-10-21 10:35:56 357

原创从壹开始解读Yolov11【源码研读系列】——cfg：模型配置加载功能

本文是从壹开始解析YOLO源码系列的开篇，基本定下此系列的行文逻辑与内容架构。本文解读了yolo配置文件的基本常用功能函数。重点在对于yolo各个部分参数配置的解读，在后续文章解析源码中，结合此处参数表查看具体参数设置得到的效果

2024-10-21 10:34:55 3158

原创从零开始使用最新版Paddle【PaddleOCR系列】——第二部分：自建数据集 + 模型微调训练

本文记录如何构建符合paddle规范的数据集，然后使用模型配置文件的命令行形式微调训练自建数据集上的新模型参数

2024-10-15 16:39:39 2282 2

原创【强化学习系列】Gym库使用——创建自己的强化学习环境3：矢量化环境+奖励函数设计

本文在单一gym环境搭建的基础上，设计简单的奖励函数，设置环境截断等改进。并将所有操作适应于矢量化的环境。

2024-09-21 11:24:43 2099 3

空空如也

如何理解机器学习中的数学基础

python selenium爬取ajax页面

python列表中空字符串操作