tangchen。-优快云博客

原创图像分割项目

定义：图像分割是深度学习领域的关键任务，核心是对目标轮廓进行预测，本质是将图像中不同像素归类到对应类别，属于细粒度极高的分类工作。应用场景：广泛覆盖多个领域，具体包括人像抠图、医学组织提取、遥感图像分析、自动驾驶场景感知、材料图像分析等。前景与背景划分：前景（物体 Things）：指可计数的前景目标，例如行人、车辆等。背景（事物 Stuff）：指不可计数的背景区域，例如天空、草地、路面等。

2025-11-27 10:34:47 332

原创 u-net 系列

整体结构以编码 - 解码流程为核心，设计简洁明了。核心创新在于引入特征拼接操作替代传统特征加法，实现 “特征全利用” 的效果。该算法实用性强、应用场景广泛，初始专为医学领域设计，至今仍是该领域分割任务的核心算法之一，核心优势在于凭借简洁结构即可高效完成分割任务。

2025-11-27 10:31:42 260

原创 YOLOv5 口罩检测实战前哨：筑牢深度学习基础，避开新手必踩坑

回顾 YOLOv5 口罩检测的实战历程，很多新手踩的坑，本质都是对基础概念的理解不足。

2025-10-28 15:52:20 663

原创 YOLOv5 的新手入门教程！！！

对于 YOLOv5 新手来说，如果你直接啃源码往往陷入 "只见函数，不见结构" 的困境。这份总结以 "可视化破冰→核心模块拆解→学习方法论" 为脉络，把复杂的网络结构拆成新手能轻松消化的知识点，帮你快速建立对 YOLOv5 的整体认知。

2025-10-28 15:32:14 469

原创 YOLOv5 核心代码深度解析：从网络架构到训练配置（附实战细节）

YOLOv5 的核心代码设计非常工程化，通过 “动态配置 + 模块化” 让开发者无需修改核心代码就能适配不同任务（如裂缝检测、目标计数、缺陷检测等）。本文拆解的三段代码是理解 YOLOv5 的关键，建议结合实际数据集动手调试，才能真正掌握其精髓。

2025-10-27 16:00:54 784

原创 YOLOv5数据加载与增强模块全面解析

高效性：通过缓存和多进程加载实现高速数据流水线多样性：集成Mosaic、MixUp、随机透视变换等多种先进增强技术灵活性：支持多种输入源和训练模式鲁棒性：完善的错误处理和数据验证机制。

2025-10-24 16:34:52 847

基础特征提取：用 CSPNet 减少计算、保留特征；多尺度处理：用 SPPNet 适配不同输入尺寸；特征融合：用 PAN 实现双向特征传递，结合 SAM/CBAM 聚焦重点；训练优化：用 Mosaic、Label Smoothing、CIoU 损失提升泛化能力和精度。速度与精度平衡：在保证实时检测（高 FPS）的同时，精度优于 YOLOv3、EfficientDet 等模型；训练门槛低：单 GPU 即可训练，无需复杂硬件；实用性强：适配多种场景（如自动驾驶、监控、工业检测），泛化能力好。

2025-10-20 15:52:29 310

原创 YOLOv3 ：目标检测的经典融合与创新

YOLOv3 并非颠覆性创新，而是 “站在巨人肩膀上的整合者”—— 它将残差连接、多尺度融合、Logistic 多标签预测等技术有机结合，针对性解决了 YOLO 系列此前在小目标检测、多标签识别上的短板，同时保持了 “单阶段检测” 的速度优势。验证了 “多尺度特征融合” 在小目标检测中的有效性，为后续 YOLOv4、YOLOv5 的尺度设计奠定基础；实现了 “精度与速度的高效平衡”，成为工业界实时目标检测（如监控、自动驾驶、零售识别）的常用模型；

2025-10-17 16:06:05 498

原创 YOLO-V1 与 YOLO-V2

YOLO-V1 的核心贡献是 “开创单阶段实时检测框架”，但受限于网格划分、边界框设计等问题，精度与适应性不足；YOLO-V2 则围绕 “解决 V1 缺陷、提升精度与鲁棒性从 “网络训练”（BN、高分辨率微调）、“架构设计”（DarkNet、1×1 卷积）、“先验知识”（聚类先验框、Anchor Box）、“特征利用”（细粒度融合、多尺度）四个维度，全面提升检测性能；

2025-10-16 15:12:14 716

原创开心实习之深度学习之卷积神经网络

卷积神经网络通过 “卷积层提取特征、池化层压缩维度、全连接层分类” 的核心流程，解决了全连接层忽略空间信息、参数过多的痛点。从 LeNet 的 “开山”，到 AlexNet 的 “爆发”，再到 VGG 的 “深度革命”，CNN 的发展始终围绕 “更高效提取特征、适配更大数据” 的目标。如今，CNN 已广泛应用于图像分类、目标检测、人脸识别等领域，其核心思想（参数共享、局部特征、自动学习）不仅局限于图像，还延伸到语音、文本等其他领域，成为深度学习的重要分支。

2025-09-19 15:34:40 705

原创开心实习之深度学习之多层感知机

多层感知机的学习过程，其实就是在外界输入样本的刺激下，不断改变网络的连接权值（还有偏差），甚至调整网络拓扑结构，让网络的输出不断接近期望的输出。它的计算速度非常快，而且能有效缓解 “梯度消失” 问题（在模型训练中，梯度越来越小，导致模型难以更新参数的问题），是目前多层感知机中最常用的激活函数之一。它的曲线呈 “S” 形，当输入为正数时，输出接近1；要实现与门，我们可以设置多个符合条件的（w1，w2，b）组合，比如（0.5，0.5，-0.7）、（0.5，0.5，-0.8）、（1.0，1.0，-1.0）。

2025-09-18 15:50:51 1060

原创开心实习之第n+1天

梯度法的具体流程也不复杂：先在某个初始位置计算梯度，然后沿着梯度方向前进一定的距离，到达新的位置后，再重新计算梯度，接着沿着新的梯度方向前进，就这么反复下去，一步一步靠近损失函数的最小值。不过要注意，梯度指的方向只是当前位置函数值减小最快的方向，不一定就是最终的最低点方向，但沿着这个方向走，总能让我们离最低点越来越近。如果学习率太大，就好比在找山的最低点时，步子迈得太大，很可能一下子就跨过头了，不仅找不到最低点，还可能在山上来回晃悠，导致损失函数的值不稳定，甚至越来越大。反之，损失函数的值就越小。

2025-09-17 16:07:34 740

原创开心实习之第n天

规则很简单：让测试者隔着屏幕，分别和 “人”、“机器” 聊天，要是测试者在很长时间里，有超过 30% 的概率把机器当成 “人”，那这台机器就算 “通过测试”，被认为有人类智能。虽然现在很多聊天机器人（比如 ChatGPT）很像人，但严格来说，还没有机器能完全通过图灵测试，不过这也成了人工智能发展的一个重要目标。深度学习不是什么 “黑科技魔法”，它本质是 “让机器从数据里学经验” 的技术。

2025-09-17 15:57:30 474

原创开心实习之第三十二天

超平面是 SVM 分类的 “决策边界”，其数学本质是n 维样本空间到 n-1 维子空间的映射若样本空间为 2 维（如平面上的点），超平面是 1 维直线；若样本空间为 3 维（如空间中的点），超平面是 2 维平面；推广到 n 维空间，超平面的统一方程为：wTx+b=0其中，w 是超平面的法向量（决定超平面的方向），b 是截距（决定超平面的位置），二者共同唯一确定超平面。

2025-08-26 14:14:52 1102

原创开心实习之第二十九天

Stacking 是一种 “分阶段” 的集成方法，核心思路是 “先利用多种基础模型生成预测结果，再将这些结果作为新特征，训练一个‘元学习器’（Meta-Learner）来输出最终预测”，相当于 “用模型学习如何结合其他模型的结果”。维度Bagging（随机森林）Stacking学习器依赖无，并行生成有，串行生成无（基础模型并行，元学习器串行）核心逻辑降低方差（减少过拟合）降低偏差（提升精度）优化结合策略（学习如何整合）优势速度快、鲁棒性强、可解释性较好精度高、能处理弱学习器。

2025-08-21 17:24:38 410

原创开心实习之第二十八天

狭义标准化（Z 值标准化）：将数据转为标准正态分布（均值 = 0，方差 = 1）；广义标准化（含归一化）：将数据固定到特定范围（如 [0,1]、[5,10]）。函数核心功能快速实现 Z 值标准化最大最小值标准化（归一化）标准 Z 值标准化（均值 = 0，方差 = 1）按绝对值最大值标准化（适用于稀疏数据）抗离群值的标准化（用中位数和四分位数，减少异常值影响）独热编码（处理名义变量）序号编码（处理有序变量）目标标签编码（处理 y 值）数据二值化（按阈值分 0/1）

2025-08-20 18:17:32 542

原创开心实习之第二十七天

决策树是一种 “白盒” 算法（逻辑直观，可解释性强），核心是通过 “选择最优属性划分数据” 构建树结构，通过 “剪枝” 避免过拟合。不同算法的核心差异在于划分准则（ID3 用信息增益、C4.5 用信息增益率、CART 用基尼指数），连续值需先离散化处理，代码实现中通过调整max_depth等参数控制模型复杂度。代码案例均来自老师课上所讲，仅供大家参考。

2025-08-19 15:27:13 920

原创开心实习之第二十六天

总之，决策树是一种 “简单但强大” 的机器学习模型，其核心逻辑围绕 “减少不确定性” 展开，通过 “熵” 和 “信息增益” 实现最优特征选择，在分类和回归任务中都有广泛应用。“晴天” 分支需进一步计算 “湿度”“是否有风” 等特征的信息增益，选择最优特征作为下一级节点，直到所有分支的熵值为 0（即所有数据都属于同一类），构造出完整的决策树。用同样的方法计算 “温度”“湿度”“是否有风” 的信息增益，最终选择 “信息增益最大” 的 “outlook（天气）” 作为根节点。

2025-08-18 15:54:30 827

原创开心实习之第二十五天

在接触机器学习的过程中，K 近邻算法（KNN）给我留下了深刻的印象。它不像有些算法那样包含复杂的数学推导和模型训练过程，反而以简单直观的思路，让我轻松理解了机器学习中 “分类” 任务的核心逻辑。通过学习 PPT 中的内容，从电影分类的实际案例到鸢尾花数据集的代码实现，我不仅掌握了 KNN 的基本原理，更体会到了 “从理论到实践” 的学习乐趣，开始是用 “电影分类” 这个贴近生活的例子，让我瞬间理解了 KNN 的核心思想 ——。

2025-08-15 16:28:20 888

原创开心实习之第二十四天

查准率（P）与查全率（R）： - 查准率（精确率）：预测为“正类”的样本中，实际为正类的比例（P=TP/(TP+FP)，TP为真正例，FP为假正例）；例如，在“好瓜预测”中，若模型预测10个“好瓜”，其中8个实际是好瓜（TP=8，FP=2），而实际共有10个好瓜（FN=2），则P=8/(8+2)=80%，R=8/(8+2)=80%。从流程上看，机器学习是“历史数据→训练模型→预测未知数据”的闭环：通过对历史数据的归纳，提炼出可复用的规律（模型），再将其应用于新的输入，实现对未来或未知问题的预测。

2025-08-14 15:57:22 327

原创开心实习之第二十三天

今天老师为我们继续完善了昨天未讲完的代码，讲解了一个双十一数据美妆分析实战案例，首先，老师为我们提供了现有的数据集。由于今天的内容是衔接昨天内容而衍生的，所以今天只有这些可以分享了，明天开始会好好开肝的。以下是爬取的代码以及讲解的具体内容。这个代码是每日销售量展示图。有关美妆品类分类的情况。

2025-08-13 16:01:32 221

原创开心实习之第二十二天

今天的课程比较简单，作业也只是复现代码。

2025-08-12 15:06:07 101

原创开心实习之第二十一天~

然后用`BeautifulSoup`解析代码，定位到表格里的“学校名称”“总分”“星级排名”这些数据——这里最关键的是找到数据在网页里的位置，比如案例里用`table>tbody>tr`定位表格行，再用`td`标签提取每一列的内容，就像在一堆文件里按“文件夹路径”找到自己要的文档一样；这次用了两种图：柱状图和饼图，各有各的本事。## 最后：原来技术的意义，是解决“自己关心的问题” 做完这个项目，最大的感受是：爬虫和数据分析从来不是孤立的技术，它们合在一起，能帮我们快速解决很多“想知道但懒得手动查”的问题。

2025-08-12 15:01:31 396

原创开心实习之第二十天~鸿蒙应用开发~

*箱线图（sns.boxplot）**：这个刚开始看有点懵，后来才明白，它能一下子把数据的分布情况说清楚——中位数在哪，四分位怎么分，有没有异常值，全都能从图里读出来，对于分析数据分布特别有用。哦对了，还有**小提琴图（sns.violinplot）**，它结合了箱线图和密度图的优点，既能看到数据的分布范围，又能看出哪里的数据更密集，形状像小提琴，还挺形象的。它的代码特别简洁，比如画个图，基本上就是"指定函数+设置x、y和数据"，剩下的美化工作它都帮你做好了，不用自己调颜色、调字体大小。

2025-08-08 16:36:46 770

原创开心实习之第十九天Matplotlib

更绝的是那个fmt参数，像'o:r'就能直接指定用圆点标记、点线连接、红色显示，不用分开调参数，简直是懒人福音——我第一次试的时候，故意把颜色换成绿色，线条换成虚线，看着自己调出来的图，还挺有成就感。比如subplot(1,2,1)，我一开始以为是“1行2列的第2个”，结果画出来位置不对，后来对着PPT里的例子试了几次才明白：哦，原来index是从左到右、从上到下数的，1行2列的话，第一个是左边，第二个是右边。imshow能显示灰度图、彩色图，甚至热力图，我试着用随机数组生成图像，看着那些颜色块还挺神奇。

2025-08-07 15:38:02 271

原创开心实习之第十八天

今天没什么特别的要给大家汇报，因为今天的任务是自己找函数，。不难，但是要找24个，总体还是比较多的，但是今天的博客很好写，给大家分享几个我自己找的函数吧那就。

2025-08-07 15:27:37 96

原创开心实习之第十七天

PPT中介绍的`pd.read_csv()`、`pd.read_excel()`、`pd.read_sql()`，几乎覆盖了日常工作中最常见的数据来源： - 对于CSV、TSV等文本文件，`read_csv()`能自动解析分隔符，快速将文本转为DataFrame；在实际练习中，我用`read_csv()`读取了一份NBA球员数据，通过`head(3)`立即看到了“姓名、球队、年龄”等字段，用`info()`发现“Salary”列有缺失值——这些信息为后续的数据清洗指明了方向。

2025-08-06 09:57:25 558

原创开心实习之第十六天

接下来还是numpy的数据科学与计算，字符串函数add：对两个数组的逐个字符串元素进行连接。center：居中字符串。数组操作之数组元素的添加与删除，resize函数:返回指定大小的新数组、append函数：在数组的末尾添加值、insert函数：在给定索引之前，沿给定轴在输入数组中插入值、delete函数：返回从输入数组中删除指定子数组的新数组。stack函数用于沿新轴连接数组序列，hstack函数通过水平堆叠来生成数组，vstack函数通过垂直堆叠来生成数组，split函数沿特定的轴将数组分割为子数组。

2025-08-05 09:44:40 122

原创开心实习之第十四天~

通过对比 NumPy 数组与 Python 列表，我深刻感受到 NumPy 在处理大量数据时的高效性，尤其是在进行数值计算时，NumPy 的向量化操作避免了循环语句，大大提升了计算速度和代码的简洁性。函数用于创建一个指定形状和数据类型但未初始化的数组，它不会为数组元素赋予初始值，因此创建速度较快，但数组中的值是随机的，适合在我们明确后续会为数组赋值，且希望快速开辟内存空间的场景。此外，省略号 “...” 在切片中非常实用，它可以使选择元组的长度与数组的维度相同，简化了高维数组的切片操作。

2025-07-31 17:50:41 930

原创开心实习之第十二天~

今天学习的主要模块依旧是爬虫应用开发，而在爬虫开发中，数据存储是关键环节，而 MySQL 作为常用的关系型数据库，常通过 pymysql 库与 Python 进行交互。首先进行的是pymysql的安装及应用，然后它的使用包括四个方面，students，然后插入数据，数据库涉及事务问题，事务存在。语句需要修改，如需使用动态字典插入数据的话代码如下;接下来的代码使用此方式爬取豆瓣图书，示例如下。语句实现的，若表新增字段，比如。上面数据插入的操作是通过构造。的操作，更改操作都必须为。操作都是对数据库进行。

2025-07-29 16:44:27 203

原创开心实习之第十一天~

子查询不止用在查询中，增删改都能用，但是用在查询中较多，另外，99%all 子查询执行优先于主查询，主查询的条件用到了子查询的结果，关于此连接查询我运用mysql语言完成了三十道题，由于体量稍大，我仅举个例将图贴到下方。SELECT 日期,店号,a.`商品编码`,商品名称,大类编码,大类名,小类编码,小类名,进价,售价,销售数量,这几天北京梅雨季了，天天都下雨但依旧闷热，蚊子每天都大快朵颐，咬的我体无完肤。单行子查询，一般搭配配条件运算符使用，>这些都是连接查询的日常运用，除此以外还有子查询和嵌套查询，

2025-07-28 15:05:11 349

原创开心实习之第十天

今天学的依旧是mysql数据基础，mysql数据操纵、select基础查询、条件查询、聚合函数、多表合并、连接查询、而我们要做到。熟悉索引与性能优化、用户权限与安全、备份与恢复，熟练掌握数据库增、删、改、查相关操作。对一组数据（一列或多列）中，常用的聚合函数有。

2025-07-25 16:44:35 263

原创开心实习之第九天~~

今天学习的是MySQL数据库基础，讲的是数据库概念，和它的简介，还安装配置了一下，今天我主要掌握的是，MySQL,SQL的基本概念和发展历史，熟悉一下它的开发环境安装，熟练掌握一下SQL的数据类型与约束知识。包括NoSQL数据库，它是一种非关系型的数据库，不是传统关系模型，提供了一种更灵活的数据存储方式。创建名为orange的表，定义了一个名为name，数据类型为varchar（可变长度字符串）、长度最大为255的列。尝试创建名为orange的表，但未定义表的列。查看当前数据库（day9）中所有的表。

2025-07-24 15:29:29 307

原创开心实习之第八天~爬虫冲冲冲！

lxml库是一种执行效率高，并且简单易学的第三方网页解析库他不是一种Python标准库也是需要自己安装的，可以在命令下使用pip命令安装。我此段代码主要分为三个步骤：发送 HTTP 请求获取网页内容，使用 XPath 解析 HTML 提取图书信息，再将提取的数据保存为 CSV 文件。选择器来提取某个节点，然后再调用相应方法获取正文内容或者属性，就可以提取我们想要的任意信息了。然后第三个作业是应用以上案例，自己爬取一个网站，我选择爬取的是豆瓣读书的科技类图书列表。对于网页的节点来说，可以定义。

2025-07-23 17:03:31 448

原创开心实习之第七天

在实际操作中，要怎么遵守robots协议呢，robots协议的使用网络爬虫，自动或人工识别robots.txt，在进行内容爬取。第二个是txt文件存储，采集网页数据后，需要存储数据，存储数据的形式多种多样，可以直接接保存为文本文件，如：TXT、JSON、CSV、Office等，而TXT文件存储的优点是操作简单，TXT文本几乎兼容任何平台。robots协议包含网络爬虫的尺寸，有爬取网页，玩转网页，还可以爬取网站爬取系列网站，甚至爬取全网。关于网络爬虫的限制，来源审查需要判断User-Agent进行限制。

2025-07-22 17:26:18 154

原创开心实习之day6

今天我学习了有序标记“ol”，和有序列表的属性start和type。还有无序列表“ul”，重中之重是超链接的使用，表格标记和图片标记，表单标记。主要任务有以下九个，“表单标记、表格标记的使用、常用的实体符号、超链接标记的使用、建立列表、图片标记、文字的修饰标记、dive和span标记、html的基本标记”我主要以其中三个为例。HTML 元素，例如设定元素的位置、颜色、大小等。还有主要用途是美化html元素的外观，对网页元素进行布局，可以对html元素进行响应式布局，实现动画效果以及2d、3d转换。

2025-07-21 17:19:20 214

空空如也

空空如也