- 博客(46)
- 收藏
- 关注
原创 u-net 系列
整体结构:以编码解码过程为核心,结构设计简洁。核心创新:引入特征拼接操作,替代传统的特征加法,实现 “特征全利用”。应用特点实用性强,应用范围广泛;初始设计用于医学领域,至今仍是该领域分割任务的重要算法。核心优势:凭借简单结构即可高效完成分割任务。
2025-10-31 16:14:15
341
原创 图像分割项目
功能分工上,卷积模块的核心功能是提取特征,通过卷积和池化操作从输入图像中获取不同层级的特征信息,输出低分辨率特征图;转置卷积中 “转置关系” 具体体现在运算过程的矩阵表达上:卷积运算可表示为 “输出向量 = 卷积稀疏矩阵 × 输入向量”,而反卷积运算可表示为 “输出向量 = 卷积稀疏矩阵的转置 × 输入向量”,即反卷积所用的稀疏矩阵是卷积所用稀疏矩阵的转置,二者在输入输出尺寸(卷积 4×4→2×2,反卷积 2×2→4×4)和运算逻辑上呈反向对应关系。在任务目标上,语义分割仅关注像素类别,不区分个体;
2025-10-29 16:10:44
933
原创 YOLOv5可视化
第三步,转换得到 onnx 文件,YOLOv5 脚本原始代码中已提供相关转换代码,直接使用即可;第四步,打开 onnx 文件进行可视化展示,此时展示效果优于.pt 文件。在 YOLOv5 的网络结构中,SPP(空间金字塔池化)模块是重要的组成部分,参与网络的特征提取与处理流程,具体在网络结构流程部分有相关应用体现。第二步,安装 onnx,使用命令。
2025-10-27 15:42:54
780
原创 YOLOv4(全)
从 PPT 中的 FPS - 精度对比图可知,在 V100 显卡环境下,YOLOv4 在相同 FPS(如 30-50 FPS)下,精度(纵轴指标)高于 YOLOv3、EfficientDet (D0-D4)、ASFF 等模型,实现了 “速度与精度” 的最优平衡。
2025-10-21 16:18:23
236
原创 YOLOV4(上)
BOF 是仅增加训练阶段计算成本,不影响推理速度的优化策略,通过改进训练过程中的数据处理、正则化方式及损失函数,提升模型泛化能力与检测精度。
2025-10-20 15:45:53
838
原创 YOLOV3
与其他主流检测模型(如 SSD、RetinaNet、R-FCN 等)相比,YOLOv3 在保证较高 mAP-50 的同时,推理时间更具优势(例如 YOLOv3-608 的 mAP-50 达 57.9,接近 RetinaNet-101-800 的水平,但推理时间仅 51ms,远低于后者的 198ms)。
2025-10-17 16:15:34
315
原创 YOLO系列介绍
YOLO(You Only Look Once)系列是深度学习领域经典的目标检测算法,属于,核心特点是将目标检测问题转化为回归问题,通过单个 CNN 网络即可完成检测,具备实时检测能力,应用场景广泛。文档重点介绍了 YOLO-V1 和 YOLO-V2 两个版本,其中 V2 是在 V1 基础上的优化升级,实现了 “更快、更强” 的性能提升。
2025-10-16 15:56:28
357
原创 深度学习(7)图像分类项目
图像分类定义核心是将不同的图像划分到对应的类别标签,最终目标是实现最小的分类误差(即让模型正确分类的样本比例尽可能高)。图像分类的三层境界通用多类别图像分类:区分 “大类” 物体,如 10 分类任务(包含飞机、汽车、鸟、猫、鹿、狗、青蛙、马、船、卡车 10 个类别),类别间差异明显,任务难度较低。子类细粒度图像分类:区分同一 “大类” 下的细分类型,如不同品种的猫、不同型号的汽车,类别间差异小,对模型特征提取能力要求更高。实例级图片分类。
2025-09-26 15:10:20
454
原创 深度学习(6)python数据处理
utils.data是 PyTorch 中处理数据集的基础模块,分为Dataset(定义数据结构)和DataLoader(批量加载)两部分,二者需配合使用。核心作用:定义数据集的存储格式、样本读取逻辑,解决 “数据如何组织” 的问题。实现要求:必须继承,并重写以下 3 个方法:__init__:初始化数据与标签(如从 numpy 数组、文件加载);:按索引index获取单个样本,需将数据转换为 PyTorch 的Tensor类型;__len__:返回数据集的总样本数。代码示例python。
2025-09-26 15:01:07
886
原创 深度学习(5)完整版
本文档由孙靖钺编写,聚焦PyTorch 神经网络工具箱的核心应用,从神经网络基础组件出发,逐步讲解工具使用、模型构建、模块自定义及训练流程,通过代码示例与运行结果,清晰呈现 PyTorch 搭建神经网络的关键步骤与逻辑。类型 1:RestNetBasicBlock(正常残差块)适用场景:输入与输出张量形状(通道数、分辨率)一致时。结构:2 个 3×3 卷积层(padding=1)+ 对应批量归一化层(),前向传播中输入x直接与卷积输出相加后过 ReLU 激活。
2025-09-26 14:54:01
735
原创 深度学习(5)
残差块类型设计目的核心结构差异输入与输出张量形状一致时,实现 “恒等映射”仅含 2 个 3×3 卷积层 + 批量规范化层,直接将输入与输出相加(x + output输入与输出形状不一致(如通道数 / 分辨率变化),需调整维度以实现相加在 2 个 3×3 卷积层基础上,增加 1×1 卷积层(extra),用于调整输入通道数与分辨率,最终相加。
2025-09-23 10:44:59
1042
原创 深度学习(4)卷积神经网络
卷积层通过 “参数共享”(同一核在全图复用)大幅减少参数数量,通过 “局部连接” 保留空间结构,是 CNN 区别于 MLP 的核心。
2025-09-19 15:54:13
1013
原创 Kmeans算法
核心概念与属性问题类型:聚类属于无监督学习问题,与有监督学习不同,其训练数据无类别标签,需模型自主发现数据内在规律。聚类定义:核心逻辑是 “将相似的东西分到一组”,通过度量数据间的相似性(基于距离),将特征相近的样本归为同一簇,特征差异大的样本归为不同簇。核心难点评估难:无标签数据无法通过 “预测值与真实值对比” 评估,需设计专门指标判断聚类合理性。调参难:关键参数(如 k 均值的 k 值)无明确先验知识,需结合数据特点与经验调整。距离度量(聚类的核心基础)欧式距离。
2025-08-25 11:05:16
727
原创 集成算法了解
集成学习(ensemble learning)的核心思想源于 “多个专家的综合判断优于单个专家”,具体是通过构建多个个体学习器,并设计合理的结合策略将它们的预测结果组合起来,最终完成学习任务,以提升模型的泛化能力与预测准确性。
2025-08-25 11:01:00
628
原创 线性回归模型
R² 与 SSE(误差平方和)、SST(总平方和)的关系可通过公式体现:R2=1−SSTSSE,其中SSE=∑i=0m(yi−y^i)2(衡量预测值与真实值的误差),SST=∑i=0m(yi−yˉ)2(衡量真实值本身的离散程度)。若 R² 为负,说明模型预测效果劣于直接使用真实值的平均值预测(通常因模型设定错误导致)。R²(决定系数)的核心意义是:衡量线性回归模型对数据的拟合程度,即模型能够解释真实值变异的比例,R² 值越大,说明模型对真实数据的解释能力越强,拟合效果越好。
2025-08-25 10:50:29
664
原创 数据预处理
序号编码适用于有序变量,因为有序变量的取值之间存在明确的顺序关系,序号编码能保留这种顺序,如学历(小学、初中、高中)编码为 1、2、3,可体现出学历的高低顺序,而名义变量若用序号编码会引入不必要的顺序关系,影响模型效果。fillna () 的特点是用指定内容替换空字段,能保留更多数据,可根据数据特点选择固定值、均值、中位数、众数等进行填补,适用于缺失值比例较高或希望保留更多样本信息的场景,如用均值填补数值型数据的缺失值,用众数填补分类数据的缺失值。:特征编码中,独热编码和序号编码分别适用于哪种类型的变量?
2025-08-20 18:24:46
591
原创 机器学习(决策树)
信息增益:熵(H):衡量数据集不确定性,熵越小纯度越高(如集合A={1,1,1,2}比B={1,2,3,4}更纯净)。决策树定义:从根节点逐步分裂至叶子节点的树形结构,数据最终落在叶子节点上。特征排列组合:实际应用中需避免穷举所有特征顺序(计算量大),优先选择信息增益高的特征。叶子节点:不再分裂的最终节点,需保证同类数据纯度(如鸢尾花分类中单节点仅含一种花)。测试阶段:根据训练好的树模型,从根节点向下遍历至叶子节点,完成分类/回归预测。对数函数性质:logₐ1=0(任何底数a),因此pᵢ=1时熵项为0。
2025-08-18 14:13:09
338
原创 机器学习(2)knn算法
K 近邻算法(KNN)指每个样本可由最接近的 K 个邻近值代表,K 为近邻数量,一般不大于 20。核心逻辑:对于无标签的新数据,通过比较其特征与样本集中数据的特征,提取最相似的 K 个数据的类别标签,以 K 个数据中出现次数最多的类别作为新数据的分类。
2025-08-15 17:59:11
384
原创 机器学习(1)
机器学习是指系统通过分析大量经验数据,从数据中归纳规律,以提升特定任务(如预测、分类)完成效果的过程。其核心逻辑为:基于经验数据→归纳规律→优化任务表现,典型案例为 2016 年阿尔法围棋(AlphaGo)以 4:1 战胜李世石。主要类型监督学习:使用带有标签(即已知结果)的数据进行训练,比如用标注了 “垃圾邮件” 或 “正常邮件” 的样本训练模型,使其能判断新邮件的类别。常见算法有线性回归、逻辑回归、决策树、支持向量机等。无监督学习。
2025-08-14 14:48:49
566
原创 数据分析与可视化
数据预处理是数据分析的基础,直接影响后续分析结果的准确性。可视化能直观呈现数据特征和规律,常用的图表及相关操作如下:。合理的分组与筛选能帮助聚焦关键数据。常见问题及解决方法。
2025-08-12 19:41:02
438
原创 matplotlib数据科学与计算
** 功能 **:从图像文件读取图像数据,返回 numpy.ndarray 对象,格式 matplotlib.pyplot.imread (fname, format=None)
2025-08-07 18:33:35
856
原创 pandas数据的科学与计算
定义:一个开源的 Python 类库,主要用于数据分析、数据处理、数据可视化。特点高性能容易使用的数据结构容易使用的数据分析工具。
2025-08-06 17:42:55
1107
原创 nump数据科学与计算3
例如,两个 2 行 2 列的数组,使用 concatenate () 沿 axis=0 连接后得到 4 行 2 列的数组(维度不变,仍为 2 维);例如,对一个 2 行 2 列的数组分别使用 flatten () 和 ravel () 得到一维数组后,修改 flatten () 返回的数组,原数组不变;(形状为 (1,3))进行相加运算,由于形状不同,广播机制被触发,b 会被自动扩展为与 a 形状相同的数组(4 行 3 列,每行都是 [1,2,3]),最终得到相加结果。(形状为 (4,3))和。
2025-08-05 08:22:11
832
原创 bs4数据解析
功能特点提供简单的、Python 式的函数处理导航、搜索、修改分析树等功能。作为工具箱,能解析文档为用户提供需抓取的数据,实现简单方便。自动将输入文档转换为 Unicode 编码,输出文档转换为 utf-8 编码,无需考虑编码方式。为用户灵活提供不同的解析策略或强劲的速度。解析器解析器使用方法优点劣势Python 标准库内置标准库、执行速度适中、文档容错能力强Python2.7.3 及 Python3.2.2 之前版本文档容错能力差lxml HTML 解析器。
2025-07-31 16:55:18
946
原创 numpy数据科学与计算
NumPy 是一个开源的 Python 科学计算库。能够直接对数组和矩阵进行操作,可省略很多循环语句,众多的数学函数让代码编写更轻松。
2025-07-31 16:51:41
656
原创 pymysql数据储存
遵循 ACID 原则:原子性(操作要么全做要么全不做)、一致性(数据库状态一致)、隔离性(事务间不干扰)、持久性(提交后永久生效)。为数据集合(列表或元组)。优势:减少与数据库的交互次数,提升存储效率,尤其适用于爬虫获取的大量数据。):建立 Python 与 MySQL 的连接,需配置主机、端口、账号等参数;PyMySQL 操作 MySQL 的核心步骤为 4 步。):作为执行 SQL 语句的载体;):实现增删改查等操作;④提交事务并关闭连接():确保操作生效并释放资源,失败则回滚(为带占位符的插入语句,
2025-07-29 19:45:45
261
原创 MySQL基础(2)
实际使用中,COUNT (*) 因效率高(无需判断字段是否为 NULL)更常用,而 COUNT (DISTINCT) 因需去重判断,效率较低,仅在需统计非重复值时使用。② 作用对象不同,WHERE 作用于表中的原始记录,HAVING 作用于 GROUP BY 的分组结果;③ 适用场景不同,WHERE 用于筛选具体字段的记录,HAVING 用于筛选聚合函数计算后的分组结果(如。例如,用左连接查询 “销售表” 和 “商品表” 时,即使某商品在销售表中无记录,也会显示该商品信息(销售相关字段为 NULL)。
2025-07-28 17:01:08
799
原创 MySQL数据库基础
基本信息:由瑞典 MySQL AB 公司开发,现属 Oracle,是流行的关系型数据库,在 Web 应用中广泛使用。特点:开源免费,功能满足个人和中小企业需求,降低总体拥有成本。概念:用于组织和访问数据库数据的标准语言,是 DBMS 的组成部分,非独立 DBMS。起源:1974 年由 Boyce 和 Chamberlin 提出,在 IBM 的 System R 中实现。组成DDL(数据定义语言):定义 / 修改数据库结构(CREATE、ALTER、DROP 等)。DML(数据操纵语言)
2025-07-24 14:21:28
690
原创 静态网页爬取模版
Requests 库的 session 对象的作用是维护一个会话,自动处理 Cookies,方便在多次请求中保留用户状态(如登录信息)。XPath 中 ““/” 表示从根节点开始选取,仅匹配直接子节点;“//” 表示从当前节点选取所有后代节点,无视位置。XPath 是用于在 XML/HTML 文档中定位信息的语言,结合 lxml 库的 etree 模块可高效解析网页。访问需登录的页面,即可利用保存的 Cookies 免重复登录。选取文档中所有 book 节点,无论其在哪个层级。
2025-07-23 18:30:57
693
原创 javaScript的初步学习
历史:起源于 Netscape,最初名为 LiveScript,后更名为 JavaScript。与 HTML、CSS 的关系HTML:超文本标记语言,构成页面骨架。CSS:层叠样式表,装饰页面。JavaScript:前端浏览器执行的脚本语言,实现动态页面效果。语法格式javascriptfunction 函数名(形式参数列表){函数体;return 返回值;调用方式函数名(实际参数列表);
2025-07-22 18:48:00
774
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
2