自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(40)
  • 收藏
  • 关注

原创 图像分割项目

定义:图像分割是深度学习领域的关键任务,核心是对目标轮廓进行预测,本质是将图像中不同像素归类到对应类别,属于细粒度极高的分类工作。应用场景:广泛覆盖多个领域,具体包括人像抠图、医学组织提取、遥感图像分析、自动驾驶场景感知、材料图像分析等。前景与背景划分:前景(物体 Things):指可计数的前景目标,例如行人、车辆等。背景(事物 Stuff):指不可计数的背景区域,例如天空、草地、路面等。

2025-11-27 10:34:47 332

原创 u-net 系列

整体结构以编码 - 解码流程为核心,设计简洁明了。核心创新在于引入特征拼接操作替代传统特征加法,实现 “特征全利用” 的效果。该算法实用性强、应用场景广泛,初始专为医学领域设计,至今仍是该领域分割任务的核心算法之一,核心优势在于凭借简洁结构即可高效完成分割任务。

2025-11-27 10:31:42 260

原创 YOLOv5 口罩检测实战前哨:筑牢深度学习基础,避开新手必踩坑

回顾 YOLOv5 口罩检测的实战历程,很多新手踩的坑,本质都是对基础概念的理解不足。

2025-10-28 15:52:20 663

原创 YOLOv5 的新手入门教程!!!

对于 YOLOv5 新手来说,如果你直接啃源码往往陷入 "只见函数,不见结构" 的困境。这份总结以 "可视化破冰→核心模块拆解→学习方法论" 为脉络,把复杂的网络结构拆成新手能轻松消化的知识点,帮你快速建立对 YOLOv5 的整体认知。

2025-10-28 15:32:14 469

原创 YOLOv5 核心代码深度解析:从网络架构到训练配置(附实战细节)

YOLOv5 的核心代码设计非常工程化,通过 “动态配置 + 模块化” 让开发者无需修改核心代码就能适配不同任务(如裂缝检测、目标计数、缺陷检测等)。本文拆解的三段代码是理解 YOLOv5 的关键,建议结合实际数据集动手调试,才能真正掌握其精髓。

2025-10-27 16:00:54 784

原创 YOLOv5数据加载与增强模块全面解析

高效性:通过缓存和多进程加载实现高速数据流水线多样性:集成Mosaic、MixUp、随机透视变换等多种先进增强技术灵活性:支持多种输入源和训练模式鲁棒性:完善的错误处理和数据验证机制。

2025-10-24 16:34:52 847

原创 YOLOv4 :兼顾速度与精度!

基础特征提取:用 CSPNet 减少计算、保留特征;多尺度处理:用 SPPNet 适配不同输入尺寸;特征融合:用 PAN 实现双向特征传递,结合 SAM/CBAM 聚焦重点;训练优化:用 Mosaic、Label Smoothing、CIoU 损失提升泛化能力和精度。速度与精度平衡:在保证实时检测(高 FPS)的同时,精度优于 YOLOv3、EfficientDet 等模型;训练门槛低:单 GPU 即可训练,无需复杂硬件;实用性强:适配多种场景(如自动驾驶、监控、工业检测),泛化能力好。

2025-10-20 15:52:29 310

原创 YOLOv3 :目标检测的经典融合与创新

YOLOv3 并非颠覆性创新,而是 “站在巨人肩膀上的整合者”—— 它将残差连接、多尺度融合、Logistic 多标签预测等技术有机结合,针对性解决了 YOLO 系列此前在小目标检测、多标签识别上的短板,同时保持了 “单阶段检测” 的速度优势。验证了 “多尺度特征融合” 在小目标检测中的有效性,为后续 YOLOv4、YOLOv5 的尺度设计奠定基础;实现了 “精度与速度的高效平衡”,成为工业界实时目标检测(如监控、自动驾驶、零售识别)的常用模型;

2025-10-17 16:06:05 498

原创 YOLO-V1 与 YOLO-V2

YOLO-V1 的核心贡献是 “开创单阶段实时检测框架”,但受限于网格划分、边界框设计等问题,精度与适应性不足;YOLO-V2 则围绕 “解决 V1 缺陷、提升精度与鲁棒性从 “网络训练”(BN、高分辨率微调)、“架构设计”(DarkNet、1×1 卷积)、“先验知识”(聚类先验框、Anchor Box)、“特征利用”(细粒度融合、多尺度)四个维度,全面提升检测性能;

2025-10-16 15:12:14 716

原创 开心实习之 深度学习之卷积神经网络

卷积神经网络通过 “卷积层提取特征、池化层压缩维度、全连接层分类” 的核心流程,解决了全连接层忽略空间信息、参数过多的痛点。从 LeNet 的 “开山”,到 AlexNet 的 “爆发”,再到 VGG 的 “深度革命”,CNN 的发展始终围绕 “更高效提取特征、适配更大数据” 的目标。如今,CNN 已广泛应用于图像分类、目标检测、人脸识别等领域,其核心思想(参数共享、局部特征、自动学习)不仅局限于图像,还延伸到语音、文本等其他领域,成为深度学习的重要分支。

2025-09-19 15:34:40 705

原创 开心实习之 深度学习之多层感知机

多层感知机的学习过程,其实就是在外界输入样本的刺激下,不断改变网络的连接权值(还有偏差),甚至调整网络拓扑结构,让网络的输出不断接近期望的输出。它的计算速度非常快,而且能有效缓解 “梯度消失” 问题(在模型训练中,梯度越来越小,导致模型难以更新参数的问题),是目前多层感知机中最常用的激活函数之一。它的曲线呈 “S” 形,当输入为正数时,输出接近1;要实现与门,我们可以设置多个符合条件的(w1​,w2​,b)组合,比如(0.5,0.5,-0.7)、(0.5,0.5,-0.8)、(1.0,1.0,-1.0)。

2025-09-18 15:50:51 1060

原创 开心实习之第n+1天

梯度法的具体流程也不复杂:先在某个初始位置计算梯度,然后沿着梯度方向前进一定的距离,到达新的位置后,再重新计算梯度,接着沿着新的梯度方向前进,就这么反复下去,一步一步靠近损失函数的最小值。不过要注意,梯度指的方向只是当前位置函数值减小最快的方向,不一定就是最终的最低点方向,但沿着这个方向走,总能让我们离最低点越来越近。如果学习率太大,就好比在找山的最低点时,步子迈得太大,很可能一下子就跨过头了,不仅找不到最低点,还可能在山上来回晃悠,导致损失函数的值不稳定,甚至越来越大。反之,损失函数的值就越小。

2025-09-17 16:07:34 740

原创 开心实习之第n天

规则很简单:让测试者隔着屏幕,分别和 “人”、“机器” 聊天,要是测试者在很长时间里,有超过 30% 的概率把机器当成 “人”,那这台机器就算 “通过测试”,被认为有人类智能。虽然现在很多聊天机器人(比如 ChatGPT)很像人,但严格来说,还没有机器能完全通过图灵测试,不过这也成了人工智能发展的一个重要目标。深度学习不是什么 “黑科技魔法”,它本质是 “让机器从数据里学经验” 的技术。

2025-09-17 15:57:30 474

原创 开心实习之第三十二天

超平面是 SVM 分类的 “决策边界”,其数学本质是n 维样本空间到 n-1 维子空间的映射若样本空间为 2 维(如平面上的点),超平面是 1 维直线;若样本空间为 3 维(如空间中的点),超平面是 2 维平面;推广到 n 维空间,超平面的统一方程为:wTx+b=0其中,w 是超平面的法向量(决定超平面的方向),b 是截距(决定超平面的位置),二者共同唯一确定超平面。

2025-08-26 14:14:52 1102

原创 开心实习之第二十九天

Stacking 是一种 “分阶段” 的集成方法,核心思路是 “先利用多种基础模型生成预测结果,再将这些结果作为新特征,训练一个‘元学习器’(Meta-Learner)来输出最终预测”,相当于 “用模型学习如何结合其他模型的结果”。维度Bagging(随机森林)Stacking学习器依赖无,并行生成有,串行生成无(基础模型并行,元学习器串行)核心逻辑降低方差(减少过拟合)降低偏差(提升精度)优化结合策略(学习如何整合)优势速度快、鲁棒性强、可解释性较好精度高、能处理弱学习器。

2025-08-21 17:24:38 410

原创 开心实习之第二十八天

狭义标准化(Z 值标准化):将数据转为标准正态分布(均值 = 0,方差 = 1);广义标准化(含归一化):将数据固定到特定范围(如 [0,1]、[5,10])。函数核心功能快速实现 Z 值标准化最大最小值标准化(归一化)标准 Z 值标准化(均值 = 0,方差 = 1)按绝对值最大值标准化(适用于稀疏数据)抗离群值的标准化(用中位数和四分位数,减少异常值影响)独热编码(处理名义变量)序号编码(处理有序变量)目标标签编码(处理 y 值)数据二值化(按阈值分 0/1)

2025-08-20 18:17:32 542

原创 开心实习之第二十七天

决策树是一种 “白盒” 算法(逻辑直观,可解释性强),核心是通过 “选择最优属性划分数据” 构建树结构,通过 “剪枝” 避免过拟合。不同算法的核心差异在于划分准则(ID3 用信息增益、C4.5 用信息增益率、CART 用基尼指数),连续值需先离散化处理,代码实现中通过调整max_depth等参数控制模型复杂度。代码案例均来自老师课上所讲,仅供大家参考。

2025-08-19 15:27:13 920

原创 开心实习之第二十六天

总之,决策树是一种 “简单但强大” 的机器学习模型,其核心逻辑围绕 “减少不确定性” 展开,通过 “熵” 和 “信息增益” 实现最优特征选择,在分类和回归任务中都有广泛应用。“晴天” 分支需进一步计算 “湿度”“是否有风” 等特征的信息增益,选择最优特征作为下一级节点,直到所有分支的熵值为 0(即所有数据都属于同一类),构造出完整的决策树。用同样的方法计算 “温度”“湿度”“是否有风” 的信息增益,最终选择 “信息增益最大” 的 “outlook(天气)” 作为根节点。

2025-08-18 15:54:30 827

原创 开心实习之第二十五天

在接触机器学习的过程中,K 近邻算法(KNN)给我留下了深刻的印象。它不像有些算法那样包含复杂的数学推导和模型训练过程,反而以简单直观的思路,让我轻松理解了机器学习中 “分类” 任务的核心逻辑。通过学习 PPT 中的内容,从电影分类的实际案例到鸢尾花数据集的代码实现,我不仅掌握了 KNN 的基本原理,更体会到了 “从理论到实践” 的学习乐趣,开始是用 “电影分类” 这个贴近生活的例子,让我瞬间理解了 KNN 的核心思想 ——。

2025-08-15 16:28:20 888

原创 开心实习之第二十四天

查准率(P)与查全率(R): - 查准率(精确率):预测为“正类”的样本中,实际为正类的比例(P=TP/(TP+FP),TP为真正例,FP为假正例);例如,在“好瓜预测”中,若模型预测10个“好瓜”,其中8个实际是好瓜(TP=8,FP=2),而实际共有10个好瓜(FN=2),则P=8/(8+2)=80%,R=8/(8+2)=80%。从流程上看,机器学习是“历史数据→训练模型→预测未知数据”的闭环:通过对历史数据的归纳,提炼出可复用的规律(模型),再将其应用于新的输入,实现对未来或未知问题的预测。

2025-08-14 15:57:22 327

原创 开心实习之第二十三天

今天老师为我们继续完善了昨天未讲完的代码,讲解了一个双十一数据美妆分析实战案例,首先,老师为我们提供了现有的数据集。由于今天的内容是衔接昨天内容而衍生的,所以今天只有这些可以分享了,明天开始会好好开肝的。以下是爬取的代码以及讲解的具体内容。这个代码是每日销售量展示图。有关美妆品类分类的情况。

2025-08-13 16:01:32 221

原创 开心实习之第二十二天

今天的课程比较简单,作业也只是复现代码。

2025-08-12 15:06:07 101

原创 开心实习之第二十一天~

然后用`BeautifulSoup`解析代码,定位到表格里的“学校名称”“总分”“星级排名”这些数据——这里最关键的是找到数据在网页里的位置,比如案例里用`table>tbody>tr`定位表格行,再用`td`标签提取每一列的内容,就像在一堆文件里按“文件夹路径”找到自己要的文档一样;这次用了两种图:柱状图和饼图,各有各的本事。## 最后:原来技术的意义,是解决“自己关心的问题” 做完这个项目,最大的感受是:爬虫和数据分析从来不是孤立的技术,它们合在一起,能帮我们快速解决很多“想知道但懒得手动查”的问题。

2025-08-12 15:01:31 396

原创 开心实习之第二十天~鸿蒙应用开发~

*箱线图(sns.boxplot)**:这个刚开始看有点懵,后来才明白,它能一下子把数据的分布情况说清楚——中位数在哪,四分位怎么分,有没有异常值,全都能从图里读出来,对于分析数据分布特别有用。哦对了,还有**小提琴图(sns.violinplot)**,它结合了箱线图和密度图的优点,既能看到数据的分布范围,又能看出哪里的数据更密集,形状像小提琴,还挺形象的。它的代码特别简洁,比如画个图,基本上就是"指定函数+设置x、y和数据",剩下的美化工作它都帮你做好了,不用自己调颜色、调字体大小。

2025-08-08 16:36:46 770

原创 开心实习之第十九天Matplotlib

更绝的是那个fmt参数,像'o:r'就能直接指定用圆点标记、点线连接、红色显示,不用分开调参数,简直是懒人福音——我第一次试的时候,故意把颜色换成绿色,线条换成虚线,看着自己调出来的图,还挺有成就感。比如subplot(1,2,1),我一开始以为是“1行2列的第2个”,结果画出来位置不对,后来对着PPT里的例子试了几次才明白:哦,原来index是从左到右、从上到下数的,1行2列的话,第一个是左边,第二个是右边。imshow能显示灰度图、彩色图,甚至热力图,我试着用随机数组生成图像,看着那些颜色块还挺神奇。

2025-08-07 15:38:02 271

原创 开心实习之第十八天

今天没什么特别的要给大家汇报,因为今天的任务是自己找函数,。不难,但是要找24个,总体还是比较多的,但是今天的博客很好写,给大家分享几个我自己找的函数吧那就。

2025-08-07 15:27:37 96

原创 开心实习之第十七天

PPT中介绍的`pd.read_csv()`、`pd.read_excel()`、`pd.read_sql()`,几乎覆盖了日常工作中最常见的数据来源: - 对于CSV、TSV等文本文件,`read_csv()`能自动解析分隔符,快速将文本转为DataFrame;在实际练习中,我用`read_csv()`读取了一份NBA球员数据,通过`head(3)`立即看到了“姓名、球队、年龄”等字段,用`info()`发现“Salary”列有缺失值——这些信息为后续的数据清洗指明了方向。

2025-08-06 09:57:25 558

原创 开心实习之第十六天

接下来还是numpy的数据科学与计算,字符串函数add:对两个数组的逐个字符串元素进行连接。center:居中字符串。数组操作之数组元素的添加与删除,resize函数:返回指定大小的新数组、append函数:在数组的末尾添加值、insert函数:在给定索引之前,沿给定轴在输入数组中插入值、delete函数:返回从输入数组中删除指定子数组的新数组。stack函数用于沿新轴连接数组序列,hstack函数通过水平堆叠来生成数组,vstack函数通过垂直堆叠来生成数组,split函数沿特定的轴将数组分割为子数组。

2025-08-05 09:44:40 122

原创 开心实习之第十四天~

通过对比 NumPy 数组与 Python 列表,我深刻感受到 NumPy 在处理大量数据时的高效性,尤其是在进行数值计算时,NumPy 的向量化操作避免了循环语句,大大提升了计算速度和代码的简洁性。函数用于创建一个指定形状和数据类型但未初始化的数组,它不会为数组元素赋予初始值,因此创建速度较快,但数组中的值是随机的,适合在我们明确后续会为数组赋值,且希望快速开辟内存空间的场景。此外,省略号 “...” 在切片中非常实用,它可以使选择元组的长度与数组的维度相同,简化了高维数组的切片操作。

2025-07-31 17:50:41 930

原创 开心实习之第十二天~

今天学习的主要模块依旧是爬虫应用开发,而在爬虫开发中,数据存储是关键环节,而 MySQL 作为常用的关系型数据库,常通过 pymysql 库与 Python 进行交互。首先进行的是pymysql的安装及应用,然后它的使用包括四个方面,students,然后插入数据,数据库涉及事务问题,事务存在。语句需要修改,如需使用动态字典插入数据的话代码如下;接下来的代码使用此方式爬取豆瓣图书,示例如下。语句实现的,若表新增字段,比如。上面数据插入的操作是通过构造。的操作,更改操作都必须为。操作都是对数据库进行。

2025-07-29 16:44:27 203

原创 开心实习之第十一天~

子查询不止用在查询中,增删改都能用,但是用在查询中较多,另外,99%all 子查询执行优先于主查询,主查询的条件用到了子查询的结果,关于此连接查询我运用mysql语言完成了三十道题,由于体量稍大,我仅举个例将图贴到下方。SELECT 日期,店号,a.`商品编码`,商品名称,大类编码,大类名,小类编码,小类名,进价,售价,销售数量,这几天北京梅雨季了,天天都下雨但依旧闷热,蚊子每天都大快朵颐,咬的我体无完肤。单行子查询,一般搭配配条件运算符使用,>这些都是连接查询的日常运用,除此以外还有子查询和嵌套查询,

2025-07-28 15:05:11 349

原创 开心实习之第十天

今天学的依旧是mysql数据基础,mysql数据操纵、select基础查询、条件查询、聚合函数、多表合并、连接查询、而我们要做到。熟悉索引与性能优化、用户权限与安全、备份与恢复,熟练掌握数据库增、删、改、查相关操作。对一组数据(一列或多列)中,常用的聚合函数有。

2025-07-25 16:44:35 263

原创 开心实习之第九天~~

今天学习的是MySQL数据库基础,讲的是数据库概念,和它的简介,还安装配置了一下,今天我主要掌握的是,MySQL,SQL的基本概念和发展历史,熟悉一下它的开发环境安装,熟练掌握一下SQL的数据类型与约束知识。包括NoSQL数据库,它是一种非关系型的数据库,不是传统关系模型,提供了一种更灵活的数据存储方式。创建名为orange的表,定义了一个名为name,数据类型为varchar(可变长度字符串)、长度最大为255的列。尝试创建名为orange的表,但未定义表的列。查看当前数据库(day9)中所有的表。

2025-07-24 15:29:29 307

原创 开心实习之第八天~爬虫冲冲冲!

lxml库是一种执行效率高,并且简单易学的第三方网页解析库他不是一种Python标准库也是需要自己安装的,可以在命令下使用pip命令安装。我此段代码主要分为三个步骤:发送 HTTP 请求获取网页内容,使用 XPath 解析 HTML 提取图书信息,再将提取的数据保存为 CSV 文件。选择器来提取某个节点,然后再调用相应方法获取正文内容或者属性,就可以提取我们想要的任意信息了。然后第三个作业是应用以上案例,自己爬取一个网站,我选择爬取的是豆瓣读书的科技类图书列表。对于网页的节点来说,可以定义。

2025-07-23 17:03:31 448

原创 开心实习之第七天

在实际操作中,要怎么遵守robots协议呢,robots协议的使用网络爬虫,自动或人工识别robots.txt,在进行内容爬取。第二个是txt文件存储,采集网页数据后,需要存储数据,存储数据的形式多种多样,可以直接接保存为文本文件,如:TXT、JSON、CSV、Office等,而TXT文件存储的优点是操作简单,TXT文本几乎兼容任何平台。robots协议包含网络爬虫的尺寸,有爬取网页,玩转网页,还可以爬取网站爬取系列网站,甚至爬取全网。关于网络爬虫的限制,来源审查需要判断User-Agent进行限制。

2025-07-22 17:26:18 154

原创 开心实习之day6

今天我学习了有序标记“ol”,和有序列表的属性start和type。还有无序列表“ul”,重中之重是超链接的使用,表格标记和图片标记,表单标记。主要任务有以下九个,“表单标记、表格标记的使用、常用的实体符号、超链接标记的使用、建立列表、图片标记、文字的修饰标记、dive和span标记、html的基本标记”我主要以其中三个为例。HTML 元素,例如设定元素的位置、颜色、大小等。还有主要用途是美化html元素的外观,对网页元素进行布局,可以对html元素进行响应式布局,实现动画效果以及2d、3d转换。

2025-07-21 17:19:20 214

原创 开心实习之第四天之第二个任务~~

还有有序列表、无序列表、超链接、图片标记、表格标记、表单标记等等。需要特别注意的是表单标记提交的方式。:将用户在表单中填写的数据包含在表单的主体中,一起传送到服务器上的处理程序中,没有字符限制。将表单的内容附加到提交地址后面,对提交信息的长度进行了限制,不能超过8192个字符。它还可以从一个文件跳转到另一个文件,与世界各地主机的文件连接(超级链接文本)它可以加入图片、声音、动画、多媒体等内容(超越了文本限制)。之间是一个容器,可以包含段落、表格、图片等各种。特点:块级标记,独占一行,换行。

2025-07-18 16:41:26 160

原创 开心实习之第四天依旧Requests!

中,如果这些数据并不是每个请求都需要发给服务端的数据,浏览器这样设置自动处理无疑增加了网络开销;当访问增多,会比较占用你服务器的性能,考虑到减轻服务器性能方面,应当使用。今天是我实习的第四天,今天我学习了requests库模拟会话,ccokies和session,ü。(比如身份认证信息),浏览器这样设置自动处理就大大免去了重复添加操作。今天我已豆瓣网站为例,登录爬取个人主页简介信息,使用密码登录,观察url地址。的值应该是一个既不会重复,又不容易被找到规律的方式以仿造的字符串,这个。

2025-07-18 16:34:31 430 1

原创 开心实习之第三天~~爬取表情包!手机归属地查询!!

昨天学习了requests库的及其常用方法,也简述了一下通用代码结构,那么今天,我们继续进行表情包的爬取和手机号归属地查询的爬取。此代码输入合法数据,观察页面请求规律。输入任意合法手机号点击查询后页面跳转,是典型的Get请求。然后我又进行了手机号码归属地查询,练习使用通用爬虫框架获取静态网页的文本内容。这个网址可以打开QQ表情包并进行爬取。今天又学到了新东西,开心开心,积极面对每一天。早晨起来~拥抱太阳~满满的正能量~~

2025-07-17 15:36:06 239

原创 实习日志之开心实习second day~~

今天是我实习的第二天,我们学习了爬虫应用开发,Requests库及其常用方法。适用于Python语言编写,基于Urllib开发,采用Apache2Licensed开源协议的HTTP库,可以帮助我们发送请求,获取请求响应的数据,如指定网页的HTTP内容。可以用于QQ表情包图片爬取,也可以用于手机号码归属地查询。return "产生异常"大抵通用代码框架如下。

2025-07-16 14:10:37 121

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除