自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(51)
  • 收藏
  • 关注

原创 U-net系列

算法版本核心改进点优势适用场景U-net编码 - 解码 + 特征拼接结构简单、小样本适应性强医学图像分割(基础款)、中小数据集分割任务U-net++密集特征融合 + 深度监督 + 易剪枝精度更高、训练稳定、支持轻量化高精度医学分割、对速度 / 精度有灵活需求的场景U-net+++多尺度 Max Pooling + 高阶上采样整合跨尺度特征融合更优复杂场景分割(研究级,实际应用较少)

2025-10-31 17:20:58 938

原创 深度学习图像分割

图像分割是深度学习在计算机视觉领域的重要任务,核心目标是预测目标轮廓,本质是对图像中每一个像素进行细粒度分类,将不同属性的像素划分到对应类别,实现从 “整图识别” 到 “像素级区分” 的突破。

2025-10-29 16:58:57 543

原创 yolov5官方使用

​。包含YOLOv5各种架构的配置文件(如。

2025-10-23 16:32:04 954

原创 yolov5

【代码】yolov5。

2025-10-23 15:39:43 311

原创 【无标题】

BOF 的核心是仅增加训练阶段成本,不影响模型推理速度,主要通过数据增强、网络正则化和损失函数优化实现。BOS 通过微调网络结构增加少量推理成本,显著提升特征提取能力,核心包含网络模块改进与注意力机制引入。

2025-10-21 19:25:02 437

原创 YOLOv4 学习笔记

YOLOv4 虽更换了作者,但延续了 YOLO 系列 “” 的核心精髓,同时以 “工程实用性” 为核心设计目标,是一款兼顾性能与落地成本的目标检测算法。

2025-10-20 15:58:59 483

原创 YOLOv3

YOLOv3 是 YOLO 系列中里程碑式的版本,核心优势在于,尤其针对小目标检测进行了重点优化,在 COCO 数据集上的表现显著优于同期多种目标检测算法。

2025-10-20 15:58:30 594

原创 yolo目标检测

衡量 “预测为正的样本中,真正为正的比例”,关注 “少误判”;公式:Precision=TP+FPTP​例:模型预测 100 个 “车”,其中 80 个是真车(TP=80),20 个是误判(FP=20),则 Precision=80/(80+20)=0.8。:衡量 “真实为正的样本中,被正确预测的比例”,关注 “少漏检”;公式:Recall=TP+FNTP​例:图像中实际有 100 辆车(TP+FN=100),模型只检测到 70 辆(TP=70),则 Recall=70/100=0.7。

2025-10-15 19:29:22 977

原创 【无标题】

摘要:卷积神经网络(CNN)通过卷积层提取图像局部特征,结合池化层降低维度,采用全局平均池化和全连接层实现分类。网络设计包含卷积、ReLU激活、池化等组件,参数量约2-3万,具有轻量级、端到端学习和层次化特征提取的特点。利用GPU加速训练,通过张量重塑处理数据,适合图像识别任务,兼顾计算效率与模型性能。

2025-09-28 10:59:37 254

原创 深度学习——加载数据

本文介绍了使用PyTorch实现CIFAR-10图像分类的关键步骤:1)导入必要的深度学习库;2)构建包含卷积层、池化层和全连接层的CNN网络;3)设置数据预处理(标准化、张量转换)和数据加载器;4)配置交叉熵损失函数和SGD优化器;5)实现模型训练循环(前向传播、反向传播、参数更新);6)评估模型性能并计算准确率。重点讲解了PyTorch核心组件使用、GPU加速、多进程处理等技术细节,为图像分类任务提供了标准实现流程。

2025-09-27 17:12:15 281

原创 深度学习-图像分类

图像分类是指将不同图像划分到对应类别标签,核心目标是实现最小分类误差,即让模型对图像类别的判断尽可能准确。

2025-09-27 15:53:50 966

原创 pytorch

使用方式nn.Xxx:先实例化(如),再调用实例处理数据nn.functional.xxx:直接调用函数(如),需手动传入参数参数管理nn.Xxx:自动封装和管理参数,可通过提取所有可学习参数nn.functional.xxx:需手动定义weight和bias,无法自动纳入模型参数管理状态切换nn.Dropout:调用后自动关闭 Dropout(适配测试阶段)F.dropout:需手动设置training参数(如)切换状态。

2025-09-22 14:23:21 355 1

原创 全连接层的局限性与 CNN

多层感知机(MLP)的全连接层仅适用于表格数据(行对应样本、列对应特征),但处理图像数据时,需将二维图像展平为一维向量输入,完全丢失了图像的空间关联性(如像素的邻域关系、物体的形状结构等)。例如,一张 RGB 图像包含宽度、高度、通道三个维度的空间信息,展平后变成单一维度的特征向量,破坏了图像的固有结构。卷积层是 CNN 的 “特征提取核心”,通过卷积核与输入图像的交叉相关运算,提取图像的局部特征(如边缘、纹理、颜色块等)。

2025-09-22 13:55:58 1049

原创 多层感知机(MLP)

核心逻辑:接收输入信号,通过权重和偏差计算,输出二分类结果(0 或 1)。本质:最简单的深度神经网络,通过引入隐藏层,将线性不可分问题转化为更高维度空间中的线性可分问题,实现用非线性曲线划分空间。结构:输入层 → 隐藏层(可多层) → 输出层。定义:将神经元输入信号的总和转换为输出信号的函数,决定神经元是否 “激活”。核心作用:为网络引入非线性,使多层感知机能够拟合复杂的非线性关系(若没有激活函数,多层网络等价于单层感知机)。连续且可导(允许少数点不可导)的非线性函数;

2025-09-19 15:18:43 1100

原创 线性回归和 Softmax 回归

线性回归:用于连续值预测,模型表达式为y=wTx+b(单样本)或y=Xw+b(多样本),通过优化损失函数(如平方损失)求解参数。Softmax 回归:用于多类分类,基于全连接神经网络结构,通过 Softmax 运算将原始输出转换为概率分布,搭配交叉熵损失函数优化参数。优化核心梯度法是参数更新的基础思想,小批量随机梯度下降是深度学习默认优化算法。关键超参数(学习率、批量值)需合理选择:学习率避免过大或过小,批量值平衡计算资源利用与参数更新稳定性。损失函数适配:回归任务常用平方损失、L1 损失;

2025-09-18 07:49:00 622

原创 深度学习预备知识

通俗理解:用人工的方法在机器(计算机)上实现的智能;或者说是人们使机器具有类似于人的智能。学科定义:人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。开发方:Meta AI(原 Facebook)人工智能研究小组。基础:基于 Lua 编写的 Torch 库的 Python 实现。优势:API 设计简洁、优雅、易懂,是课程推荐学习的开源框架。

2025-09-16 15:06:10 992

原创 支持向量机

基本需求:D在样本空间中找到一个划分超平面、将不同类别的样本分开理想中的超平面:该划分超平面对训练样本局部扰动的“容忍性”最好优化目标:最大化margin注:找支持向量机越近越好而d越大越好超平面:超平面H是从n维空间到n-1维空间的一个映射子空间,它有一个n维向量和一个实数定义。如果空间是三维的,那么它的超平面是二维平面,而如果空间是二维的,则其超平面是一维直线。超平面可以使用方程表。

2025-08-26 19:23:50 376

原创 朴素贝叶斯分类器

多项式模型不适合处理连续变量,高斯模型不适合处理离散变量。​ 连续型特征数据(具体数值,符合或近似正态分布)。​ 文本分类(侧重特征是否出现,而非出现次数)。​ 离散型特征数据(特别是文本数据)。​ 文本分类(如统计单词出现次数)。​ 处理连续变量(如测量值)。​ 离散型特征数据且取值​。文本/离散计数 --

2025-08-25 19:37:26 381

原创 机器学习-线性回归

线性回归是通过属性的线性组合进行预测的线性模型,核心目标是找到一条直线、平面或更高维的超平面,使预测值与真实值之间的误差最小化。例如在房屋价格预测场景中,通过拟合 “价格 = 房屋大小” 这样的直线来实现预测:对于由d个属性描述的样本x=(x1​;x2​;⋅⋅⋅;xd​),线性模型的预测函数为f(x)=w1​x1​+w2​x2​+...+wd​xd​+b,向量形式可简写为f(x)=wTx+b,其中w为权重向量,b为偏置项。

2025-08-25 08:17:12 318

原创 机器学习聚类算法

无监督学习(无标签数据)目标:将相似数据分到同一组。

2025-08-21 19:35:08 339

原创 数据预处理

本文总结了数据预处理中缺失值处理和标准化方法:1) Pandas缺失值处理包括isnull()检测、dropna()删除和fillna()填充;2) Sklearn的SimpleImputer提供均值/中位数/常数/众数填补策略;3) 标准化方法包括MinMaxScaler归一化和StandardScaler标准差标准化;4) 特征编码技术如独热编码和序号编码;5) 数据二值化通过阈值将数值转换为0/1两类。这些方法可消除量纲影响,提高数据质量便于后续分析。

2025-08-20 18:46:26 881

原创 决策树学习

​:信息增益(属性带来的熵增)​:选择信息增益最大的属性(纯度提升最大)​:偏好取值较多的属性(如“编号”),易导致过拟合信息增益率 = 信息增益 ÷ 自身熵​​:缓解ID3对多值属性的偏好,提升泛化能力​:基尼指数(Gini Index)公式:Gini(D)=1−∑pi2​(p越大,Gini(D)越小,则数据集D的纯度越高)​:随机抽取两个样本类别不一致的概率​:基尼指数越小,数据集纯度越高​:通过分箱(离散化)或寻找最佳划分阈值,将连续属性转化为离散值。

2025-08-19 18:52:34 438

原创 机器学习(决策树)

​:衡量随机变量的不确定性(数据混乱程度)。

2025-08-18 15:42:49 944

原创 机器学习实例应用

K近邻算法(KNN,k-Nearest Neighbor),每个样本都可以用它的最接近的K个邻近值来代表。算法说明:①输入没有标签的新数据,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据(最近邻)的分类标签。②一般来说,只选择样本数据集中k个最相似的数据。k一般不大于20,最后选择k个数据中出现次数最多的分类,作为新数据的分类。K近邻算法(KNN,k-Nearest Neighbor),每个样本都可以用它的最接近的K个邻近值来代表。

2025-08-18 10:31:26 844

原创 机器学习介绍

机器学习是一种让计算机系统通过分析大量经验(数据),在特定任务上不断改进自身性能的方 法。核心:处理特定任务。依赖大量经验数据。有明确的任务完成好坏评判标准。通过分析数据使任务完成得更好。

2025-08-18 08:44:27 453

原创 机器学习知识总结

机器学习(Machine Learning, ML)是一门多领域交叉学科,融合了概率论、统计学、微积分、代数学以及算法复杂度理论等众多学科知识,是实现人工智能的核心手段。其定义为:机器通过学习数据中的内在规律性信息,获取新经验与知识,从而提升和改善自身性能,以实现类似人类的决策过程。

2025-08-14 16:12:17 679

原创 电商双11美妆数据分析2

男士专用护肤品的销售量前三名分别是:妮维雅,欧莱雅,相宜本草。所有男士商品主要销量来自于护肤品。可以看出基本都是男用唇膏。因为将唇膏归于了口红类,而口红类归于了化妆品类。

2025-08-13 19:04:28 300

原创 电商双11美妆数据分析

事实上,D类中,也就是高端商品中,雅诗兰黛占据了主要份额,一方面可能由于品牌效应,就个人主观的分析,雅诗兰黛为人熟知,在推广营销方面做的很好,所以销量尚可。观察饼图,不难发现A类平均单价的品牌所占的销售额比例最高,D类最少,并且D类中的一半以上收入都来自于雅诗兰黛品牌,而最受欢迎的相宜本草由于其价格便宜,销售额也最高。相宜本草商品数量也只属于中游,但其销量销售额均排在第一位,由于其销量是第二名的大约两倍,而销售额远不到两倍,所以销售额/销量,也就是每一单的均价也是一个值得研究的新指标。

2025-08-12 17:46:39 757

原创 数据科学与计算实例应用

爬取高三网中国大学排名一览表,爬取数据包括学校名称、总分、全国排名、星级排名、办学层级。爬取后的数据保存在CSV文件中。网址为 http://www.bspider.top/gaosan/发现school.csv中的“总分”那一列有一些空数据。

2025-08-11 18:27:20 310

原创 【无标题】matplotlib与seaborn数据库

Seaborn 是一个建立在 Matplotlib 基础之上的 Python 数据可视化库,专注于绘制各种统计图形,以便更轻松地呈现和理解数据。

2025-08-11 17:54:11 417

原创 数据可视化Matplotlib

Matplotlib 是 Python 的绘图库,它能让使用者很轻松地将数据图形化,并且提供多样化的输出格 式。​​图表类型​​​​函数​​​​关键参数​​​​参数解释​​​​折线图​​plt.plot()markerlinestylecolor​​marker​​: 数据点标记样式('o'圆形、's'方形、'*'星号等)​​linestyle​​: 线条样式('-'实线、'--'虚线、':'点线等)​​color​​: 线条颜色(名称如'red'、十六进制值如。

2025-08-07 18:21:51 889

原创 数据科学与计算pandas

1.已知考试成绩占总成绩的60%,而平时的成绩占总成绩的40%,那么请你们帮忙算一算各位同学各个科目的最终成绩。2.计算每个同学的平均分以及每个科目的平均分。3.计算每个同学的最高分以及每个科目的最高分。计算列的中位数替换空单元格。计算列的均值替换空单元格。

2025-08-06 18:21:57 215

原创 科学与数据numpy4

​​​​​​​sort()数组排序成绩排名argsort()排序索引成绩排名索引argmax()最大值索引最高分学生定位where()条件索引及格学生筛选extract()条件提取优秀学生筛选argsort():返回的是数组值从小到大的索引值max()和min():沿给定轴返回最大或者最小值nonzero():返回输入数组中非零元素的索引where():返回输入数组中满足给定条件的元素的索引extract():根据某个条件从数组中抽取元素。

2025-08-06 18:16:44 589

原创 数据科学与计算3

NumPy提供了丰富的数组操作函数,主要包括: 数组连接:concatenate()沿现有轴连接,stack()新增维度堆叠,hstack()/vstack()实现水平/垂直堆叠 数组分割:split()通用分割,hsplit()/vsplit()专用于列/行分割 数组修改:resize()调整大小,append()追加,insert()/delete()插入删除,unique()去重 字符串操作:提供add()连接、multiply()重复、center()填充等字符串处理方法 数值处理:包含round(

2025-08-04 16:54:37 783

原创 数据科学与计算2numpy

NumPy对不同形状数组进行数值计算的自动化机制。从尾部维度开始比较,维度大小:相等、其中一个为1、其中一个不存在。维度扩展:在缺失维度或大小为1的维度上复制数据。像这幅图中a为4x3的维度是二维,b是一维,因此b应该也拓展为4x3的维度np.tile()​:作用:重复数组的各个维度以匹配目标形状其中reps指定每个维度的重复次数。

2025-08-01 16:11:21 922

原创 数据科学与计算(numpy)

介绍:NumPy是一个开源的Python科学计算库,能够直接对数组和矩阵进行操作,可以省略很多循环语句,众多的数学函数也会让编写代码的工作轻松许多。

2025-07-31 19:25:12 790

原创 爬虫解析(BeautifulSoup)

name:依据节点来查询元素;attrs:依据一些属性来查询;text:可用匹配节点的文本来查询。自动处理编码(输入→Unicode,输出→UTF-8),简化编码问题;支持多种解析策略(如lxml、html5lib)兼顾灵活性与效率。​处理HTML/XML文档的导航、搜索与修改;的内置标准库、执行速度适中、文档容错能力强。最好的容错性、以浏览器的方式解析文档、生成。→ 获取特定属性值(后者支持异常处理)。→ 所有子孙节点文本(推荐)速度快、文档容错能力强。→ 返回属性字典(如。(推荐4.x版本)。

2025-07-30 19:38:48 1207

原创 爬虫(数据存储)

本文介绍了PyMySQL库的安装与基本使用方法,用于Python连接MySQL数据库。主要内容包括:PyMySQL安装方式(pip安装)、数据库连接建立、游标对象操作、SQL语句执行(增删改查)及事务处理(ACID特性)。文章详细展示了连接参数设置、创建表、插入数据的代码示例,并提供了一个完整的豆瓣图书爬虫案例,演示如何将爬取数据存储到MySQL数据库。最后强调了数据库操作中事务处理的重要性,包括commit()和rollback()的使用方法。

2025-07-29 19:24:41 1466

原创 爬虫(MySQL3)练习题答案模板

本文介绍了MySQL数据库的建表与查询操作。首先创建了学生、课程、教师和成绩四个表,设置主键并插入模拟数据。然后展示了多种查询操作,包括:1) 单表查询(如查询女生信息);2) 多表连接查询(如学生课程成绩关联);3) 聚合统计(如平均分、最高分);4) 复杂条件查询(如不及格科目统计);5) 分组筛选(如选修人数超过5人的课程)。最后总结了学习收获,包括数据操作语句、查询执行逻辑、条件筛选技巧、多表连接方法等。这些操作全面覆盖了数据库基础应用场景,为数据分析提供了实用方法。

2025-07-29 10:28:21 819

原创 爬虫(MySQL3)

​ 根据两个表或多个表的列之间的关系,从这些表中查询数据。​ 实现多个表查询操作。连接之前必须确保俩表有相同的一列SELECT `销售表`.`店号`,`店铺表`.`店名`,`销售表`.`商品编码`,`销售表`.`销售数量`FROM `销售表`,`店铺表` WHERE `店铺表`.`店号`=`销售表`.`店号`;上述语句,店铺表和销售表两个表名反复出现,使代码趋于复杂,此时我们可以使用表的别名进行简化。

2025-07-29 10:20:31 1365

爬虫学习(MySQL3)

练习

2025-07-29

爬虫学习(MySQL3)

代码

2025-07-29

爬虫学习(MySQL2)

我所用到的xlsx表

2025-07-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除