小五127-优快云博客

原创 U-net系列

算法版本核心改进点优势适用场景U-net编码 - 解码 + 特征拼接结构简单、小样本适应性强医学图像分割（基础款）、中小数据集分割任务U-net++密集特征融合 + 深度监督 + 易剪枝精度更高、训练稳定、支持轻量化高精度医学分割、对速度 / 精度有灵活需求的场景U-net+++多尺度 Max Pooling + 高阶上采样整合跨尺度特征融合更优复杂场景分割（研究级，实际应用较少）

2025-10-31 17:20:58 938

原创深度学习图像分割

图像分割是深度学习在计算机视觉领域的重要任务，核心目标是预测目标轮廓，本质是对图像中每一个像素进行细粒度分类，将不同属性的像素划分到对应类别，实现从 “整图识别” 到 “像素级区分” 的突破。

2025-10-29 16:58:57 543

原创 yolov5官方使用

。包含YOLOv5各种架构的配置文件（如。

2025-10-23 16:32:04 954

原创【无标题】

BOF 的核心是仅增加训练阶段成本，不影响模型推理速度，主要通过数据增强、网络正则化和损失函数优化实现。BOS 通过微调网络结构增加少量推理成本，显著提升特征提取能力，核心包含网络模块改进与注意力机制引入。

2025-10-21 19:25:02 437

原创 YOLOv4 学习笔记

YOLOv4 虽更换了作者，但延续了 YOLO 系列 “” 的核心精髓，同时以 “工程实用性” 为核心设计目标，是一款兼顾性能与落地成本的目标检测算法。

2025-10-20 15:58:59 483

原创 YOLOv3

YOLOv3 是 YOLO 系列中里程碑式的版本，核心优势在于，尤其针对小目标检测进行了重点优化，在 COCO 数据集上的表现显著优于同期多种目标检测算法。

2025-10-20 15:58:30 594

衡量 “预测为正的样本中，真正为正的比例”，关注 “少误判”；公式：Precision=TP+FPTP例：模型预测 100 个 “车”，其中 80 个是真车（TP=80），20 个是误判（FP=20），则 Precision=80/(80+20)=0.8。：衡量 “真实为正的样本中，被正确预测的比例”，关注 “少漏检”；公式：Recall=TP+FNTP例：图像中实际有 100 辆车（TP+FN=100），模型只检测到 70 辆（TP=70），则 Recall=70/100=0.7。

2025-10-15 19:29:22 977

原创【无标题】

摘要：卷积神经网络（CNN）通过卷积层提取图像局部特征，结合池化层降低维度，采用全局平均池化和全连接层实现分类。网络设计包含卷积、ReLU激活、池化等组件，参数量约2-3万，具有轻量级、端到端学习和层次化特征提取的特点。利用GPU加速训练，通过张量重塑处理数据，适合图像识别任务，兼顾计算效率与模型性能。

2025-09-28 10:59:37 254

原创深度学习——加载数据

本文介绍了使用PyTorch实现CIFAR-10图像分类的关键步骤：1）导入必要的深度学习库；2）构建包含卷积层、池化层和全连接层的CNN网络；3）设置数据预处理（标准化、张量转换）和数据加载器；4）配置交叉熵损失函数和SGD优化器；5）实现模型训练循环（前向传播、反向传播、参数更新）；6）评估模型性能并计算准确率。重点讲解了PyTorch核心组件使用、GPU加速、多进程处理等技术细节，为图像分类任务提供了标准实现流程。

2025-09-27 17:12:15 281

原创深度学习-图像分类

图像分类是指将不同图像划分到对应类别标签，核心目标是实现最小分类误差，即让模型对图像类别的判断尽可能准确。

2025-09-27 15:53:50 966

原创 pytorch

使用方式nn.Xxx：先实例化（如），再调用实例处理数据nn.functional.xxx：直接调用函数（如），需手动传入参数参数管理nn.Xxx：自动封装和管理参数，可通过提取所有可学习参数nn.functional.xxx：需手动定义weight和bias，无法自动纳入模型参数管理状态切换nn.Dropout：调用后自动关闭 Dropout（适配测试阶段）F.dropout：需手动设置training参数（如）切换状态。

2025-09-22 14:23:21 355 1

原创全连接层的局限性与 CNN

多层感知机（MLP）的全连接层仅适用于表格数据（行对应样本、列对应特征），但处理图像数据时，需将二维图像展平为一维向量输入，完全丢失了图像的空间关联性（如像素的邻域关系、物体的形状结构等）。例如，一张 RGB 图像包含宽度、高度、通道三个维度的空间信息，展平后变成单一维度的特征向量，破坏了图像的固有结构。卷积层是 CNN 的 “特征提取核心”，通过卷积核与输入图像的交叉相关运算，提取图像的局部特征（如边缘、纹理、颜色块等）。

2025-09-22 13:55:58 1049

原创多层感知机（MLP）

核心逻辑：接收输入信号，通过权重和偏差计算，输出二分类结果（0 或 1）。本质：最简单的深度神经网络，通过引入隐藏层，将线性不可分问题转化为更高维度空间中的线性可分问题，实现用非线性曲线划分空间。结构：输入层 → 隐藏层（可多层） → 输出层。定义：将神经元输入信号的总和转换为输出信号的函数，决定神经元是否 “激活”。核心作用：为网络引入非线性，使多层感知机能够拟合复杂的非线性关系（若没有激活函数，多层网络等价于单层感知机）。连续且可导（允许少数点不可导）的非线性函数；

2025-09-19 15:18:43 1100

原创线性回归和 Softmax 回归

线性回归：用于连续值预测，模型表达式为y=wTx+b（单样本）或y=Xw+b（多样本），通过优化损失函数（如平方损失）求解参数。Softmax 回归：用于多类分类，基于全连接神经网络结构，通过 Softmax 运算将原始输出转换为概率分布，搭配交叉熵损失函数优化参数。优化核心梯度法是参数更新的基础思想，小批量随机梯度下降是深度学习默认优化算法。关键超参数（学习率、批量值）需合理选择：学习率避免过大或过小，批量值平衡计算资源利用与参数更新稳定性。损失函数适配：回归任务常用平方损失、L1 损失；

2025-09-18 07:49:00 622

原创深度学习预备知识

通俗理解：用人工的方法在机器（计算机）上实现的智能；或者说是人们使机器具有类似于人的智能。学科定义：人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。开发方：Meta AI（原 Facebook）人工智能研究小组。基础：基于 Lua 编写的 Torch 库的 Python 实现。优势：API 设计简洁、优雅、易懂，是课程推荐学习的开源框架。

2025-09-16 15:06:10 992

原创支持向量机

基本需求：D在样本空间中找到一个划分超平面、将不同类别的样本分开理想中的超平面：该划分超平面对训练样本局部扰动的“容忍性”最好优化目标：最大化margin注：找支持向量机越近越好而d越大越好超平面：超平面H是从n维空间到n-1维空间的一个映射子空间，它有一个n维向量和一个实数定义。如果空间是三维的，那么它的超平面是二维平面，而如果空间是二维的，则其超平面是一维直线。超平面可以使用方程表。

2025-08-26 19:23:50 376

原创朴素贝叶斯分类器

多项式模型不适合处理连续变量，高斯模型不适合处理离散变量。连续型特征数据（具体数值，符合或近似正态分布）。文本分类（侧重特征是否出现，而非出现次数）。离散型特征数据（特别是文本数据）。文本分类（如统计单词出现次数）。处理连续变量（如测量值）。离散型特征数据且取值。文本/离散计数 --

2025-08-25 19:37:26 381

原创机器学习-线性回归

线性回归是通过属性的线性组合进行预测的线性模型，核心目标是找到一条直线、平面或更高维的超平面，使预测值与真实值之间的误差最小化。例如在房屋价格预测场景中，通过拟合 “价格 = 房屋大小” 这样的直线来实现预测：对于由d个属性描述的样本x=(x1;x2;⋅⋅⋅;xd)，线性模型的预测函数为f(x)=w1x1+w2x2+...+wdxd+b，向量形式可简写为f(x)=wTx+b，其中w为权重向量，b为偏置项。

2025-08-25 08:17:12 318

原创机器学习聚类算法

无监督学习（无标签数据）目标：将相似数据分到同一组。

2025-08-21 19:35:08 339

原创数据预处理

本文总结了数据预处理中缺失值处理和标准化方法：1) Pandas缺失值处理包括isnull()检测、dropna()删除和fillna()填充；2) Sklearn的SimpleImputer提供均值/中位数/常数/众数填补策略；3) 标准化方法包括MinMaxScaler归一化和StandardScaler标准差标准化；4) 特征编码技术如独热编码和序号编码；5) 数据二值化通过阈值将数值转换为0/1两类。这些方法可消除量纲影响，提高数据质量便于后续分析。

2025-08-20 18:46:26 881

原创决策树学习

：信息增益（属性带来的熵增）：选择信息增益最大的属性（纯度提升最大）：偏好取值较多的属性（如“编号”），易导致过拟合信息增益率 = 信息增益 ÷ 自身熵：缓解ID3对多值属性的偏好，提升泛化能力：基尼指数（Gini Index）公式：Gini(D)=1−∑pi2（p越大，Gini(D)越小，则数据集D的纯度越高）：随机抽取两个样本类别不一致的概率：基尼指数越小，数据集纯度越高：通过分箱（离散化）或寻找最佳划分阈值，将连续属性转化为离散值。

2025-08-19 18:52:34 438

原创机器学习（决策树）

：衡量随机变量的不确定性（数据混乱程度）。

2025-08-18 15:42:49 944

原创机器学习实例应用

K近邻算法(KNN,k-Nearest Neighbor),每个样本都可以用它的最接近的K个邻近值来代表。算法说明：①输入没有标签的新数据，将新数据的每个特征与样本集中数据对应的特征进行比较，然后算法提取样本集中特征最相似数据（最近邻）的分类标签。②一般来说，只选择样本数据集中k个最相似的数据。k一般不大于20，最后选择k个数据中出现次数最多的分类，作为新数据的分类。K近邻算法(KNN,k-Nearest Neighbor),每个样本都可以用它的最接近的K个邻近值来代表。

2025-08-18 10:31:26 844

原创机器学习介绍

机器学习是一种让计算机系统通过分析大量经验（数据），在特定任务上不断改进自身性能的方法。核心：处理特定任务。依赖大量经验数据。有明确的任务完成好坏评判标准。通过分析数据使任务完成得更好。

2025-08-18 08:44:27 453

原创机器学习知识总结

机器学习（Machine Learning, ML）是一门多领域交叉学科，融合了概率论、统计学、微积分、代数学以及算法复杂度理论等众多学科知识，是实现人工智能的核心手段。其定义为：机器通过学习数据中的内在规律性信息，获取新经验与知识，从而提升和改善自身性能，以实现类似人类的决策过程。

2025-08-14 16:12:17 679

原创电商双11美妆数据分析2

男士专用护肤品的销售量前三名分别是：妮维雅，欧莱雅，相宜本草。所有男士商品主要销量来自于护肤品。可以看出基本都是男用唇膏。因为将唇膏归于了口红类，而口红类归于了化妆品类。

2025-08-13 19:04:28 300

原创电商双11美妆数据分析

事实上，D类中，也就是高端商品中，雅诗兰黛占据了主要份额，一方面可能由于品牌效应，就个人主观的分析，雅诗兰黛为人熟知，在推广营销方面做的很好，所以销量尚可。观察饼图，不难发现A类平均单价的品牌所占的销售额比例最高，D类最少，并且D类中的一半以上收入都来自于雅诗兰黛品牌，而最受欢迎的相宜本草由于其价格便宜，销售额也最高。相宜本草商品数量也只属于中游，但其销量销售额均排在第一位，由于其销量是第二名的大约两倍，而销售额远不到两倍，所以销售额/销量，也就是每一单的均价也是一个值得研究的新指标。

2025-08-12 17:46:39 757

原创数据科学与计算实例应用

爬取高三网中国大学排名一览表，爬取数据包括学校名称、总分、全国排名、星级排名、办学层级。爬取后的数据保存在CSV文件中。网址为 http://www.bspider.top/gaosan/发现school.csv中的“总分”那一列有一些空数据。

2025-08-11 18:27:20 310

原创【无标题】matplotlib与seaborn数据库

Seaborn 是一个建立在 Matplotlib 基础之上的 Python 数据可视化库，专注于绘制各种统计图形，以便更轻松地呈现和理解数据。

2025-08-11 17:54:11 417

原创数据可视化Matplotlib

Matplotlib 是 Python 的绘图库，它能让使用者很轻松地将数据图形化，并且提供多样化的输出格式。图表类型函数关键参数参数解释折线图plt.plot()markerlinestylecolormarker: 数据点标记样式（'o'圆形、's'方形、'*'星号等）linestyle: 线条样式（'-'实线、'--'虚线、':'点线等）color: 线条颜色（名称如'red'、十六进制值如。

2025-08-07 18:21:51 889

原创数据科学与计算pandas

1.已知考试成绩占总成绩的60％，而平时的成绩占总成绩的40％，那么请你们帮忙算一算各位同学各个科目的最终成绩。2.计算每个同学的平均分以及每个科目的平均分。3.计算每个同学的最高分以及每个科目的最高分。计算列的中位数替换空单元格。计算列的均值替换空单元格。

2025-08-06 18:21:57 215

原创科学与数据numpy4

sort()数组排序成绩排名argsort()排序索引成绩排名索引argmax()最大值索引最高分学生定位where()条件索引及格学生筛选extract()条件提取优秀学生筛选argsort()：返回的是数组值从小到大的索引值max()和min()：沿给定轴返回最大或者最小值nonzero()：返回输入数组中非零元素的索引where()：返回输入数组中满足给定条件的元素的索引extract()：根据某个条件从数组中抽取元素。

2025-08-06 18:16:44 589

原创数据科学与计算3

NumPy提供了丰富的数组操作函数，主要包括：数组连接：concatenate()沿现有轴连接，stack()新增维度堆叠，hstack()/vstack()实现水平/垂直堆叠数组分割：split()通用分割，hsplit()/vsplit()专用于列/行分割数组修改：resize()调整大小，append()追加，insert()/delete()插入删除，unique()去重字符串操作：提供add()连接、multiply()重复、center()填充等字符串处理方法数值处理：包含round(

2025-08-04 16:54:37 783

爬虫学习（MySQL3）

爬虫学习（MySQL3）

爬虫学习（MySQL2）

空空如也