wwww.bo-优快云博客

原创 u-net 系列

整体结构：以编码解码过程为核心，结构设计简洁。核心创新：引入特征拼接操作，替代传统的特征加法，实现 “特征全利用”。应用特点实用性强，应用范围广泛；初始设计用于医学领域，至今仍是该领域分割任务的重要算法。核心优势：凭借简单结构即可高效完成分割任务。

2025-10-31 16:14:15 341

功能分工上，卷积模块的核心功能是提取特征，通过卷积和池化操作从输入图像中获取不同层级的特征信息，输出低分辨率特征图；转置卷积中 “转置关系” 具体体现在运算过程的矩阵表达上：卷积运算可表示为 “输出向量 = 卷积稀疏矩阵 × 输入向量”，而反卷积运算可表示为 “输出向量 = 卷积稀疏矩阵的转置 × 输入向量”，即反卷积所用的稀疏矩阵是卷积所用稀疏矩阵的转置，二者在输入输出尺寸（卷积 4×4→2×2，反卷积 2×2→4×4）和运算逻辑上呈反向对应关系。在任务目标上，语义分割仅关注像素类别，不区分个体；

2025-10-29 16:10:44 933

原创 YOLOv5可视化

第三步，转换得到 onnx 文件，YOLOv5 脚本原始代码中已提供相关转换代码，直接使用即可；第四步，打开 onnx 文件进行可视化展示，此时展示效果优于.pt 文件。在 YOLOv5 的网络结构中，SPP（空间金字塔池化）模块是重要的组成部分，参与网络的特征提取与处理流程，具体在网络结构流程部分有相关应用体现。第二步，安装 onnx，使用命令。

2025-10-27 15:42:54 780

原创 YOLOv4（全）

从 PPT 中的 FPS - 精度对比图可知，在 V100 显卡环境下，YOLOv4 在相同 FPS（如 30-50 FPS）下，精度（纵轴指标）高于 YOLOv3、EfficientDet (D0-D4)、ASFF 等模型，实现了 “速度与精度” 的最优平衡。

2025-10-21 16:18:23 236

原创 YOLOV4（上）

BOF 是仅增加训练阶段计算成本，不影响推理速度的优化策略，通过改进训练过程中的数据处理、正则化方式及损失函数，提升模型泛化能力与检测精度。

2025-10-20 15:45:53 838

原创 YOLOV3

与其他主流检测模型（如 SSD、RetinaNet、R-FCN 等）相比，YOLOv3 在保证较高 mAP-50 的同时，推理时间更具优势（例如 YOLOv3-608 的 mAP-50 达 57.9，接近 RetinaNet-101-800 的水平，但推理时间仅 51ms，远低于后者的 198ms）。

2025-10-17 16:15:34 315

原创 YOLO系列介绍

YOLO（You Only Look Once）系列是深度学习领域经典的目标检测算法，属于，核心特点是将目标检测问题转化为回归问题，通过单个 CNN 网络即可完成检测，具备实时检测能力，应用场景广泛。文档重点介绍了 YOLO-V1 和 YOLO-V2 两个版本，其中 V2 是在 V1 基础上的优化升级，实现了 “更快、更强” 的性能提升。

2025-10-16 15:56:28 357

原创目标检测项目

【代码】目标检测项目。

2025-10-15 17:21:58 729

原创深度学习（7）图像分类项目

图像分类定义核心是将不同的图像划分到对应的类别标签，最终目标是实现最小的分类误差（即让模型正确分类的样本比例尽可能高）。图像分类的三层境界通用多类别图像分类：区分 “大类” 物体，如 10 分类任务（包含飞机、汽车、鸟、猫、鹿、狗、青蛙、马、船、卡车 10 个类别），类别间差异明显，任务难度较低。子类细粒度图像分类：区分同一 “大类” 下的细分类型，如不同品种的猫、不同型号的汽车，类别间差异小，对模型特征提取能力要求更高。实例级图片分类。

2025-09-26 15:10:20 454

原创深度学习（6）python数据处理

utils.data是 PyTorch 中处理数据集的基础模块，分为Dataset（定义数据结构）和DataLoader（批量加载）两部分，二者需配合使用。核心作用：定义数据集的存储格式、样本读取逻辑，解决 “数据如何组织” 的问题。实现要求：必须继承，并重写以下 3 个方法：__init__：初始化数据与标签（如从 numpy 数组、文件加载）；：按索引index获取单个样本，需将数据转换为 PyTorch 的Tensor类型；__len__：返回数据集的总样本数。代码示例python。

2025-09-26 15:01:07 886

原创深度学习（5）完整版

本文档由孙靖钺编写，聚焦PyTorch 神经网络工具箱的核心应用，从神经网络基础组件出发，逐步讲解工具使用、模型构建、模块自定义及训练流程，通过代码示例与运行结果，清晰呈现 PyTorch 搭建神经网络的关键步骤与逻辑。类型 1：RestNetBasicBlock（正常残差块）适用场景：输入与输出张量形状（通道数、分辨率）一致时。结构：2 个 3×3 卷积层（padding=1）+ 对应批量归一化层（），前向传播中输入x直接与卷积输出相加后过 ReLU 激活。

2025-09-26 14:54:01 735

原创深度学习（5）

残差块类型设计目的核心结构差异输入与输出张量形状一致时，实现 “恒等映射”仅含 2 个 3×3 卷积层 + 批量规范化层，直接将输入与输出相加（x + output输入与输出形状不一致（如通道数 / 分辨率变化），需调整维度以实现相加在 2 个 3×3 卷积层基础上，增加 1×1 卷积层（extra），用于调整输入通道数与分辨率，最终相加。

2025-09-23 10:44:59 1042

原创深度学习（4）卷积神经网络

卷积层通过 “参数共享”（同一核在全图复用）大幅减少参数数量，通过 “局部连接” 保留空间结构，是 CNN 区别于 MLP 的核心。

2025-09-19 15:54:13 1013

原创深度学习（3）多层感知机

由美国学者。

2025-09-18 16:13:20 943

原创深度学习（2）线性回归与Softmax 回归

答案：二者的核心差异体现在 “输出目标” 与 “模型功能” 上：答案：答案：

2025-09-17 13:41:57 896

原创深度学习（1）

答案：答案：机器学习的关键组件包括数据、模型、目标函数、算法，角色如下：答案：

2025-09-16 17:05:08 695

原创 Kmeans算法

核心概念与属性问题类型：聚类属于无监督学习问题，与有监督学习不同，其训练数据无类别标签，需模型自主发现数据内在规律。聚类定义：核心逻辑是 “将相似的东西分到一组”，通过度量数据间的相似性（基于距离），将特征相近的样本归为同一簇，特征差异大的样本归为不同簇。核心难点评估难：无标签数据无法通过 “预测值与真实值对比” 评估，需设计专门指标判断聚类合理性。调参难：关键参数（如 k 均值的 k 值）无明确先验知识，需结合数据特点与经验调整。距离度量（聚类的核心基础）欧式距离。

2025-08-25 11:05:16 727

原创集成算法了解

集成学习（ensemble learning）的核心思想源于 “多个专家的综合判断优于单个专家”，具体是通过构建多个个体学习器，并设计合理的结合策略将它们的预测结果组合起来，最终完成学习任务，以提升模型的泛化能力与预测准确性。

2025-08-25 11:01:00 628

原创线性回归模型

R² 与 SSE（误差平方和）、SST（总平方和）的关系可通过公式体现：R2=1−SSTSSE，其中SSE=∑i=0m(yi−y^i)2（衡量预测值与真实值的误差），SST=∑i=0m(yi−yˉ)2（衡量真实值本身的离散程度）。若 R² 为负，说明模型预测效果劣于直接使用真实值的平均值预测（通常因模型设定错误导致）。R²（决定系数）的核心意义是：衡量线性回归模型对数据的拟合程度，即模型能够解释真实值变异的比例，R² 值越大，说明模型对真实数据的解释能力越强，拟合效果越好。

2025-08-25 10:50:29 664

原创数据预处理

序号编码适用于有序变量，因为有序变量的取值之间存在明确的顺序关系，序号编码能保留这种顺序，如学历（小学、初中、高中）编码为 1、2、3，可体现出学历的高低顺序，而名义变量若用序号编码会引入不必要的顺序关系，影响模型效果。fillna () 的特点是用指定内容替换空字段，能保留更多数据，可根据数据特点选择固定值、均值、中位数、众数等进行填补，适用于缺失值比例较高或希望保留更多样本信息的场景，如用均值填补数值型数据的缺失值，用众数填补分类数据的缺失值。：特征编码中，独热编码和序号编码分别适用于哪种类型的变量？

2025-08-20 18:24:46 591

原创机器学习（决策树2）

【代码】机器学习（决策树2）

2025-08-19 18:08:56 740

原创机器学习（决策树）

信息增益：熵（H）：衡量数据集不确定性，熵越小纯度越高（如集合A={1,1,1,2}比B={1,2,3,4}更纯净）。决策树定义：从根节点逐步分裂至叶子节点的树形结构，数据最终落在叶子节点上。特征排列组合：实际应用中需避免穷举所有特征顺序（计算量大），优先选择信息增益高的特征。叶子节点：不再分裂的最终节点，需保证同类数据纯度（如鸢尾花分类中单节点仅含一种花）。测试阶段：根据训练好的树模型，从根节点向下遍历至叶子节点，完成分类/回归预测。对数函数性质：logₐ1=0（任何底数a），因此pᵢ=1时熵项为0。

2025-08-18 14:13:09 338

原创机器学习（2）knn算法

K 近邻算法（KNN）指每个样本可由最接近的 K 个邻近值代表，K 为近邻数量，一般不大于 20。核心逻辑：对于无标签的新数据，通过比较其特征与样本集中数据的特征，提取最相似的 K 个数据的类别标签，以 K 个数据中出现次数最多的类别作为新数据的分类。

2025-08-15 17:59:11 384

原创机器学习（1）

机器学习是指系统通过分析大量经验数据，从数据中归纳规律，以提升特定任务（如预测、分类）完成效果的过程。其核心逻辑为：基于经验数据→归纳规律→优化任务表现，典型案例为 2016 年阿尔法围棋（AlphaGo）以 4:1 战胜李世石。主要类型监督学习：使用带有标签（即已知结果）的数据进行训练，比如用标注了 “垃圾邮件” 或 “正常邮件” 的样本训练模型，使其能判断新邮件的类别。常见算法有线性回归、逻辑回归、决策树、支持向量机等。无监督学习。

2025-08-14 14:48:49 566

原创数据分析与可视化

数据预处理是数据分析的基础，直接影响后续分析结果的准确性。可视化能直观呈现数据特征和规律，常用的图表及相关操作如下：。合理的分组与筛选能帮助聚焦关键数据。常见问题及解决方法。

2025-08-12 19:41:02 438

原创爬虫与数据分析结和

【代码】爬虫与数据分析结和。

2025-08-11 19:29:43 793 2

原创 matplotlib数据科学与计算

** 功能 **：从图像文件读取图像数据，返回 numpy.ndarray 对象，格式 matplotlib.pyplot.imread (fname, format=None)

2025-08-07 18:33:35 856

原创 numpy（4）

【代码】numpy（4）

2025-08-06 17:48:44 231

原创 pandas数据的科学与计算

定义：一个开源的 Python 类库，主要用于数据分析、数据处理、数据可视化。特点高性能容易使用的数据结构容易使用的数据分析工具。

2025-08-06 17:42:55 1107

原创 nump数据科学与计算3

例如，两个 2 行 2 列的数组，使用 concatenate () 沿 axis=0 连接后得到 4 行 2 列的数组（维度不变，仍为 2 维）；例如，对一个 2 行 2 列的数组分别使用 flatten () 和 ravel () 得到一维数组后，修改 flatten () 返回的数组，原数组不变；（形状为 (1,3)）进行相加运算，由于形状不同，广播机制被触发，b 会被自动扩展为与 a 形状相同的数组（4 行 3 列，每行都是 [1,2,3]），最终得到相加结果。（形状为 (4,3)）和。

2025-08-05 08:22:11 832

原创 numpy数据科学与计算（2）

【代码】numpy数据科学与计算（2）

2025-08-01 14:30:49 272

原创 bs4数据解析

功能特点提供简单的、Python 式的函数处理导航、搜索、修改分析树等功能。作为工具箱，能解析文档为用户提供需抓取的数据，实现简单方便。自动将输入文档转换为 Unicode 编码，输出文档转换为 utf-8 编码，无需考虑编码方式。为用户灵活提供不同的解析策略或强劲的速度。解析器解析器使用方法优点劣势Python 标准库内置标准库、执行速度适中、文档容错能力强Python2.7.3 及 Python3.2.2 之前版本文档容错能力差lxml HTML 解析器。

2025-07-31 16:55:18 946

原创 numpy数据科学与计算

NumPy 是一个开源的 Python 科学计算库。能够直接对数组和矩阵进行操作，可省略很多循环语句，众多的数学函数让代码编写更轻松。

2025-07-31 16:51:41 656

原创 pymysql数据储存

遵循 ACID 原则：原子性（操作要么全做要么全不做）、一致性（数据库状态一致）、隔离性（事务间不干扰）、持久性（提交后永久生效）。为数据集合（列表或元组）。优势：减少与数据库的交互次数，提升存储效率，尤其适用于爬虫获取的大量数据。）：建立 Python 与 MySQL 的连接，需配置主机、端口、账号等参数；PyMySQL 操作 MySQL 的核心步骤为 4 步。）：作为执行 SQL 语句的载体；）：实现增删改查等操作；④提交事务并关闭连接（）：确保操作生效并释放资源，失败则回滚（为带占位符的插入语句，

2025-07-29 19:45:45 261

原创 MySQL基础（2）

实际使用中，COUNT (*) 因效率高（无需判断字段是否为 NULL）更常用，而 COUNT (DISTINCT) 因需去重判断，效率较低，仅在需统计非重复值时使用。② 作用对象不同，WHERE 作用于表中的原始记录，HAVING 作用于 GROUP BY 的分组结果；③ 适用场景不同，WHERE 用于筛选具体字段的记录，HAVING 用于筛选聚合函数计算后的分组结果（如。例如，用左连接查询 “销售表” 和 “商品表” 时，即使某商品在销售表中无记录，也会显示该商品信息（销售相关字段为 NULL）。

2025-07-28 17:01:08 799

空空如也

空空如也