自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(41)
  • 收藏
  • 关注

原创 U-net系列算法

关键操作:引入特征拼接(Concatenation) 操作,区别于传统的特征加法(Element-wise Sum),实现 “高低阶特征全利用”,提升分割精度。特征图统一与组合:各层均通过 3×3 卷积将特征图数量统一为 64 个,最终通过 “5×64=320” 的特征组合,整合所有层级特征,形成完整特征表达。设计逻辑:通过多层级、多路径的特征拼接,将可利用的特征 “全整合”,形成 U-net 的升级版,进一步提升特征利用率与分割性能。核心流程:采用 “编码 - 解码” 架构,是实现图像分割的核心逻辑。

2025-10-31 13:37:11 384

原创 YOLOv5 源码

PAN(路径聚合网络)是 YOLOv5 特征融合的核心结构,通过上采样将深层高语义特征传递至浅层,同时通过下采样将浅层高分辨率特征传递至深层,解决传统特征金字塔中深层特征分辨率低、浅层特征语义弱的问题,实现不同尺度特征的充分融合,最终提升模型对小、中、大各类尺寸目标的检测精度。详细介绍一下YOLOv5模型的核心模块结构。如何使用YOLOv5模型进行目标检测?图像分割常用的数据集有哪些?

2025-10-29 15:30:09 613

原创 图像分割项目

图像分割是一种细粒度的图像分类任务,核心目标是预测目标轮廓,将图像中不同像素精准划分到对应类别,实现像素级别的类别区分。

2025-10-29 15:17:21 282

原创 YOLOV4

整合上述 BOS 和 BOF 中的技术,形成 YOLOv4 的完整网络,兼顾精度、速度与训练便捷性。除了PPT中提到的方法,还有哪些可以提升目标检测模型性能的技巧?如何理解YOLOv4中GIoU、DIoU、CIoU损失?详细介绍一下YOLOv4中的Mosaic数据增强方法。把关键方法、作用和优势浓缩成表格,方便快速回顾。要不要我帮你整理一份。

2025-10-20 15:27:21 464

原创 YOLOV3

比如 YOLOv3-608 版本,准确率能达到 57.9,接近 RetinaNet-101 等模型,但检测速度更快(51ms),比很多同类模型(如 DSSD513 的 156ms)效率更高。先验框数量更多:设计了 9 种先验框(比 YOLOv2 的 5 种多),按 3 种 “尺度” 分配,每种尺度对应 3 种规格,覆盖更多物体大小。借鉴了 ResNet 的思路,在网络中加入残差连接,能堆叠更多层来提取特征,同时避免训练时出现 “梯度消失” 的问题,让模型更稳定。一、YOLOv3 的核心改进。

2025-10-17 16:21:22 139

原创 YOLOV1与YOLOV2

2025-10-16 16:02:48 349

原创 图像分类项目

图像分类旨在将不同图像划分到对应类别标签,核心目标是实现最小分类误差,是深度学习在计算机视觉领域的重要应用方向。

2025-09-27 15:38:25 629

原创 图像分类项目

图像分类的核心目标是将不同图像划分到对应类别标签,最终实现分类误差最小化。指标名称核心定义计算逻辑(基于 TP/FP/TN/FN)精确率(Accuracy)模型整体分类精度,即 “识别正确的样本数占总样本数的比例”,是最常用的基础指标准确率(Precision,查准率)模型预测为 “正类” 的样本中,真正为正类的比例(聚焦 “预测正类的准确性”)召回率(Recall,查全率)所有真实正类样本中,被模型正确识别为正类的比例(聚焦 “正类的覆盖度”)F1-Score。

2025-09-25 15:41:06 790

原创 卷积神经网络

总体而言,CNN 通过利用图像空间结构、共享参数、分层提取特征等优势,解决了传统神经网络处理图像的瓶颈,从 LeNet 到 AlexNet 再到 VGG,其架构不断向 “更深、更宽、更高效” 演进,成为计算机视觉领域的核心技术。

2025-09-19 16:07:05 562

原创 多层感知机主要内容介绍

提出背景:由美国学者 Frank Rosenblatt 于 1957 年提出,是神经网络的基础组件。输入输出关系:给定输入x、权重w和偏差b,输出规则为:当\(b + w_1x_1 + w_2x_2 \leq 0\)时,输出 0;当\(b + w_1x_1 + w_2x_2 > 0\)时,输出 1,用于二分类任务(输出 0 或 1),区别于回归(输出实数)和 Softmax(输出概率,用于多分类)。关键参数权重w:控制输入信号的重要性。偏差b:调整神经元被激活的容易程度。

2025-09-18 15:47:13 874

原创 线性回归与 Softmax 回归核心内容总结

公式为 \(H(p,q) = -\sum p_i \log(q_i)\),其中 p 是样本真实概率分布(如 “属于第 3 类” 则真实分布为 [0,0,1,...,0]),q 是模型输出的预测概率分布,交叉熵损失能更精准地衡量两个概率分布的差异,推动模型优化。的基础模型,区别于线性回归的 “连续值预测”,其目标是预测样本属于多个离散类别的概率(如手写数字识别(10 类)、ImageNet 图像分类(1000 类)、维基百科恶语评论分类(7 类)等)。Softmax 回归是。

2025-09-17 14:53:56 1040

原创 机器学习与深度学习介绍

在人工智能飞速发展的当下,机器学习与深度学习作为核心技术,不仅推动着技术革新,更深刻改变着人们的生产生活。二者既存在紧密关联,又有着明确的边界与差异,共同构成了智能应用的技术基石。

2025-09-17 14:51:41 1117

原创 深度学习介绍

自定义Dataset# 实例化并批量加载print(f"批次{i}:数据{data}, 标签{label}")

2025-09-01 14:22:18 298

原创 支持向量机(SVM)核心总结:原理、优化与代码实现

支持向量机(SVM)是机器学习中经典的线性分类算法,核心目标是在样本空间找到最优划分超平面,兼具理论严谨性与实际实用性。结合 PPT 内容,可从核心思想、优化过程、关键技术及代码实现四方面展开总结。

2025-08-26 19:15:02 546

原创 朴素贝叶斯算法全解析:原理、变种与代码实现

朴素贝叶斯是机器学习中经典的分类算法,核心围绕贝叶斯公式展开,通过 “特征独立” 的朴素假设简化计算,在文本分类、数据预测等场景中应用广泛。结合两份 PPT 内容,我们可从原理、算法变种、代码实现三方面全面梳理。

2025-08-26 19:13:32 471

原创 学习 k 均值聚类算法的心得

初始中心的选择、样本的指派、中心的更新,每一步都环环相扣。欧式距离作为最常见的度量方式,计算的是多维空间中两点的直线距离,在二维、三维空间中直观易懂,推广到 n 维空间后仍保持数学上的严谨性。课堂练习中,我尝试创建不同特征的数据集,观察 k 值变化对聚类结果的影响,这种动手实践让抽象的理论变得具体可感,也让我更深刻地理解了参数调优的重要性。未来,我将继续深入学习 k 值选择的优化方法(如肘部法)、处理复杂簇形状的改进算法,努力将理论知识转化为解决实际问题的能力,在数据科学的道路上不断探索前行。

2025-08-21 19:27:47 463

原创 数据预处理学习心得:从理论到实践的桥梁搭建

数据预处理不仅是技术操作,更是深入理解数据的过程。每一种方法的选择,都基于对数据分布、异常值、业务含义的洞察。这份 PPT 让我系统掌握了 scikit-learn 的预处理工具链,更让我意识到:优秀的预处理能减少模型 “纠错” 负担,让模型专注于学习核心规律。未来实践中,我会带着 “数据探索先行、按需选择工具” 的思路,让预处理真正成为建模的 “助力器”。

2025-08-20 19:36:37 473

原创 决策树介绍

从根节点开始一步步走到叶子节点(决策) 所有的数据最终都会落到叶子节点,既可以做分类也可以做回归。决策树)是一种基于树状结构进行决策分析的机器学习算法,也是一种直观易懂的预测模型。它通过模拟人类决策过程中的 “问答逻辑”,将数据特征与目标结果之间的关系以树的形式可视化,广泛应用于分类、回归任务以及数据分析和决策支持场景。树的组成:根节点第一个选择点 非叶子节点与分支:中间过程 叶子节点:最终的决策结果决策树的训练与测试:训练阶段。

2025-08-18 16:42:55 464

原创 机器学习介绍

1. 增加训练数据:更多的样本能够让模型学习到更多更有效的特征,减小噪声的影响。3. 正则化(regularization)的技术,保留所有的特征,但是减少参数的大小(magnitude),它可以改善或者减少过拟合问题。2. 增加模型复杂度:简单模型的学习能力较差,通过增加模型的复杂度可以使模型拥有更强的拟合能力。:把训练数据学习的太彻底,以至于把噪声数据的特征也学习到了,特征集过大,这样就会导致在后期测试的时候不能够很好的识别数据,不能正确的分类,模型泛化能力太差。

2025-08-14 16:23:18 444

原创 Matplotlib 柱形图和饼图简介

柱形图有多种衍生形式,最常见的包括垂直柱形图和水平柱形图,垂直柱形图适用于类别名称较短的情况,水平柱形图则更适合类别名称较长或类别数量较多的场景,能避免标签重叠问题。在实际应用中,柱形图常用于比较不同产品的销量、不同部门的业绩、不同地区的人口数量等场景。饼图是用圆形和扇形来展示数据的图表,整个圆代表数据的总和,每个扇形的角度和面积对应某一类别在总体中所占的比例。堆叠柱形图则将不同类别的数据堆叠在同一根柱子上,既能显示每个类别的具体数值,又能直观呈现总体数据的大小,适合展示部分与整体的关系。

2025-08-13 19:31:41 435

原创 用 Python 解锁双 11 美妆数据

这次分析让我明白,数据分析不是炫技,而是解决问题的工具。通过代码清洗数据、提取特征、可视化结果,我们发现:双 11 美妆消费重性价比,护肤品是刚需,男士市场集中在基础护肤,且促销周期需覆盖预热和返场。对商家来说,这些结论能指导选品(多推平价清洁 / 补水类)、定价(主打中端市场)和营销节奏(提前预热 + 返场延续)。对消费者,也能更理性看待促销,避开高峰下单。如果你也想做数据分析,记住:好的分析始于干净的数据,成于清晰的逻辑,终于实用的结论。下次面对海量数据时,不妨打开 Python,让数据告诉你答案。

2025-08-12 16:52:22 306

原创 Seaborn 实用图表大揭秘 —— 让数据规律一目了然

上一篇我们认识了 Seaborn 的 “极简” 和 “高颜值”,这一篇我们来深入它的核心功能 —— 那些专为数据分析设计的实用图表。Seaborn 不仅能画基础图表,更擅长通过可视化揭示数据背后的统计规律,让复杂数据变得直观易懂。1. 统计分布类图表:看穿数据 “长相”想知道数据的分布范围、集中趋势?distplothistplotpython运行python运行python运行2. 关系类图表:发现变量间的 “秘密”regplotpython运行pairplotpython运行。

2025-08-12 16:47:37 268

原创 第一篇:初识 Seaborn—— 让数据可视化告别 “丑代码”

如果你用过 Python 的 Matplotlib 画图表,可能会有这样的经历:明明只是想画个简单的散点图,却要写十几行代码调整坐标轴、字体、颜色,最后出来的图还可能歪歪扭扭。而今天要介绍的 Seaborn,就是来解决这个问题的 —— 它让数据可视化从 “繁琐调参” 变成 “轻松出图”。什么是 Seaborn?Seaborn 是基于 Matplotlib 开发的 Python 数据可视化库,简单来说,它是 Matplotlib 的 “升级版”。

2025-08-12 16:46:18 382

原创 字符串函数

其中,查找子串位置的函数能定位某个字符或短语在字符串中的位置,比如在日志中查找错误关键词的位置。基础的字符串函数包括长度计算函数,它能快速返回字符串中字符的数量,比如计算用户名的长度是否符合注册要求。在编程中,字符串是由字符组成的序列,是最常用的数据类型之一。进阶的字符串函数还包括格式化函数,它能按指定格式拼接数据,比如将日期数字格式化为 “年 - 月 - 日” 的字符串。比如处理用户评论时,可先去除文本前后的空格,再将内容转为小写,然后用分割函数按标点拆分句子,最后统计关键词出现的频率。

2025-08-07 19:19:43 191

原创 Pandas介绍

Pandas 是 Python 生态中最流行的,由 Wes McKinney 于 2008 年开发。它基于 NumPy 构建,提供了高效、灵活且易于使用的数据结构和工具,专门用于处理结构化数据(如表格数据、时间序列等),是数据科学、机器学习、数据分析等领域的核心工具之一。

2025-08-07 19:17:31 577

原创 数组操作之翻转数组

是一种基础且重要的操作,其核心目标是改变数组中元素的排列顺序,使原数组的第一个元素变为最后一个,第二个元素变为倒数第二个,以此类推,最终得到一个与原数组顺序完全相反的新数组(或在原数组上直接修改)。(需遍历数组的一半元素或全部元素),选择原地翻转还是创建新数组,需根据是否允许修改原数组及空间需求决定。掌握翻转逻辑不仅能解决基础问题,也是理解更复杂算法(如链表翻转)的基础。不修改原数组,通过遍历原数组的逆序元素创建新数组,空间复杂度为。直接在原数组上进行元素交换,不额外创建新数组,空间复杂度为。

2025-08-05 18:58:17 281

原创 数组操作之修改数组形状

今天给大家介绍一下数组的操作之一,修改数组形状首先第一个便是最常见的reshape()函数在 NumPy 中,是常用操作,核心是调整数组的维度布局,不改变元素数据,却能适配不同计算场景。

2025-08-04 15:35:01 334

原创 详解 NumPy 广播机制:让不同形状数组的运算更高效

例如,形状为 (3,) 的一维数组与形状为 (2,3) 的二维数组运算时,一维数组会被补成 (1,3),与二维数组维度一致。在图像处理中,给三维图像数组(形状为 (高度,宽度,3))的 RGB 三个通道分别乘以不同权重(形状为 (3,)),广播会自动将权重扩展到与图像数组匹配的形状,轻松实现颜色调整。此时,广播机制就像一位 “隐形的调解者”,自动调整数组形状,让运算顺利进行。总的来说,NumPy 广播机制是数值计算中的 “隐形助手”,它通过智能的形状调整规则,让不同形状数组的运算变得简单高效。

2025-08-01 17:27:32 166

原创 BeautifulSoup基本介绍

打个比方,网页的 HTML 代码就像一堆杂乱的积木,标签嵌套、属性混杂,直接看很难快速找到关键内容。如果要爬取网页里的图片链接,只需找到所有<img>标签,再提取它们的src属性,就能得到图片的 URL 列表。无论是爬取新闻资讯、提取商品价格,还是分析网页结构,它都能大大降低开发难度,让开发者把精力放在数据处理上,而不是纠结于 HTML 的语法细节。简单来说,它是 Python 里一个专门用来解析 HTML 和 XML 文档的库,能把复杂的网页代码转换成易于操作的树形结构,让开发者轻松提取想要的信息。

2025-07-31 19:36:16 319

原创 PyMySQL 安装及基本使用指南

在 Python 开发中,与 MySQL 数据库交互是常见需求,而 PyMySQL 作为一款纯 Python 编写的 MySQL 客户端库,凭借轻量、易用的特点被广泛应用。本文将详细介绍 PyMySQL 的安装方法及基本使用流程,帮助开发者快速上手。一、PyMySQL 的安装安装 PyMySQL 前,需确保已安装 Python 环境(建议 Python 3.4 及以上版本)和 pip 包管理工具。

2025-07-30 18:40:56 462

原创 MySQL 聚合函数:数据统计分析的利器

此外,HAVING子句可以对聚合后的结果进行筛选,比如SELECT department_id, AVG(salary) FROM employees GROUP BY department_id HAVING AVG(salary) > 5000;MAX () 和 MIN () 函数用于找出一列中的最大值和最小值,它们不仅适用于数值类型,还能用于字符串和日期类型。掌握 MySQL 聚合函数的用法,能让我们在处理数据统计需求时更加高效便捷,无论是简单的数量统计还是复杂的分组分析,都能轻松应对。

2025-07-29 19:37:15 299

原创 MYSQL条件查询

1、升序 SELECT 字段名 FROM 表名 ORDER BY 字段名 ASC (ASC可以省略默认升序) 2、降序 SELECT 字段名 FROM 表名 ORDEY BY 字段名1 DESC(,字段名2 ASC) 3、按长度 SELECT 字段名 FROM 表名 ORDEY BY LENGTH(字段名) 注意1:ORDER BY后面可以是字段,也可以是表达式,也可以是别名 注意2:在同时使用 ORDER BY 和 WHERE 子句时,应该让 ORDER BY 位于 WHERE 之后,否则报错;

2025-07-29 19:32:37 246

原创 Mysql简介

我在 Windows 上开发调试,部署到 Linux 服务器,几乎不用改什么配置,和 Apache、Nginx 搭配合适,和 PHP、Python 这些语言也能无缝对接。我之前维护过一个用户量不大的系统,就靠简单的备份脚本和 MySQL 的恢复功能,躲过好几次误删数据的坑,可靠性还是经得住考验的。社区版完全免费,功能也够用,不像有些商业数据库,光授权费就能把小项目压垮。总的来说,MySQL 就像数据库里的 “老黄牛”,不花哨,但靠谱、能打,无论你是新手入门,还是企业级应用,它都能给你稳稳的支撑。

2025-07-25 18:26:23 440

原创 数据库概念

是一个长期存储在计算机内的、有组织的、可共享的、统一管理的大量数据的集合。它对数据库进行统一的管理和控制,以保证数据库的安全性和完整性。它使用户能方便地定义和操纵数据,维护数据的安全性和完整性,以及进行多用户下的并发控制和恢复数据库。它使用表格(也称为关系)来存储数据,并通过SQL(Structured Query Language,结构化查询语言)或其他特定于系统的数据库查询语言来管理这些数据。是一种非关系型的数据库,全称为Not Only SQL,泛指非关系型的数据库。数据库( DataBase )

2025-07-24 18:40:56 240

原创 Xpath用法及介绍

etree模块 通过Xpath解析DOM树的时候要使用lxml库的etree模块,etree模块可方便地从Html源码中获得目标内容。:谓语用来查找某个特定的节点或者包含某个指定的值的节点,谓语被嵌在方括号中。XPath使用路径表达式在XML文档中选取节点,节点是通过沿着路径或者step来选取的。XPath使用路径表达式在XML文档中选取节点,节点是通过沿着路径或者step来选取的。从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。子元素,而不管它们在文档中的位置。选取此节点的所有子节点。

2025-07-24 18:38:36 212

原创 REQUESTS高级用法以及Xpath基本用法

XPath,全称XML Path Language,是一门在XML文档中查找信息的语言。因此,在需要保存用户数据时,服务器程序可以把用户数据写到用户浏览器独占的Session中,当用户使用浏览器访问其它程序时,其它程序可以从用户的Session中取出该用户的数据,为用户服务。形象地说,它是网络信息的中转站,是个人网络和Internet服务商之间的中间代理机构,负责转发合法的网络信息,对转发进行控制和登记。REQUESTS高级用法主要分为四类,1、会话设置 2、文件上传 3、SSL证书验证 4、代理设置。

2025-07-23 18:54:51 227

原创 HTML深入介绍

<img src="微信图片_20250721140632.jpg" alt="图片不存在">

2025-07-21 19:28:14 126

原创 HTML简介

什么是HTMLHTML指的是超文本标记语言(HyperText Markup Language),它是用来描述网页的一种语言。HTML不是一种编程语言,而是一种标记语言(markup language)。所谓超文本,有2层含义: 它可以加入图片、声音、动画、多媒体等内容(超越了文本限制)。它还可以从一个文件跳转到另一个文件,与世界各地主机的文件连接(超级链接文本)。基本语法概括。

2025-07-18 19:19:46 306

原创 关于更深层次的爬虫应用开发介绍

需要使用浏览器的开发者工具,拦截网络请求,从而分析出登录提交的URL地址。如果客户端请求不包含Session Id,则为此客户端创建一个Session并且生成一个与此Session相关联的Session id,Session Id的值应该是一个既不会重复,又不容易被找到规律的方式以仿造的字符串,这个Session Id将被在本次响应中返回给客户端保存。大家可以对个人信息以及账号密码自行更改,换成自己的,这个代码可以对简单的网站进行深层爬取从而进行登录操作,但对于一些反爬比较强的网站是用不了的。

2025-07-18 15:19:30 1472

原创 爬虫应用开发简介

1、 Requests库简介 Requests库是使用Python语言编写,基于Urllib开发,采用Apache2 Licensed开源协议的HTTP库,可以帮助我们发送请求,获取请求响应的数据,如指定网页的HTML内容。Requests库支持HTTP连接保持和连接池,支持使用cookie保持会话,支持文件上传,支持自动确定响应内容的编码,支持国际化的URL和POST数据自动编码等功能。这些代码并不复杂,都可以进行简单爬取,如果要自己用以上代码的话,记得把手机号和网址换成自己想要进行爬取的。

2025-07-17 17:22:01 1254

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除