- 博客(50)
- 收藏
- 关注
原创 YOLOv4(续)
YOLOv4 以 “单 GPU 训练” 为基础,通过 BOF(数据 + 损失 + 正则化)解决 “数据质量与过拟合”,通过 BOS(注意力 + 特征融合 + 网络结构)强化 “特征提取与利用”,最终实现 “速度与精度的最优平衡”。
2025-10-29 14:47:03
141
原创 YOLOv4
该模块聚焦数据增强、网络正则化、损失函数设计三大方向,解决过拟合、类别不平衡、预测框定位不准等问题。:解决 IOU 损失的局限性,提升预测框定位精度。:通过多样化输入数据,提升模型泛化能力。:抑制过拟合,让模型更 “稳健”
2025-10-20 19:24:20
250
原创 YOLOv3
针对目标检测中 “一个物体可能有多个标签” 的场景,YOLOv3 用 Logistic 激活函数替代传统 Softmax 层。相比 YOLOv2 的 5 种先验框,YOLOv3 扩展至 9 种,且按尺度分配到不同特征图,适配不同大小的目标。为覆盖不同大小的目标,YOLOv3 设计了 3 种尺度的特征图进行预测,对应不同的网格尺寸和检测范围。YOLOv3 的网络架构摒弃传统池化和全连接层,采用全卷积设计,同时融入残差连接,优化特征提取与传递。
2025-10-20 14:24:14
356
原创 YOLOv1/v2
YOLO-V2 在 V1 基础上进行多方面优化,实现 “更快、更强” 的检测效果,VOC2007 数据集 mAP 从 63.4 提升至 78.6。YOLO-V1 是经典的 one-stage 目标检测模型,核心是将检测问题转化为回归问题,用单个 CNN 完成任务,可实现视频实时检测。
2025-10-16 16:15:40
931
原创 目标检测算法
识别任务:判断图像中存在哪些预设类别的物体(如 “人”“车”“狗”);定位任务:用边界框精确标记每个物体在图像中的位置,确保后续应用(如自动驾驶避障、安防监控追踪)可精准定位目标。
2025-10-15 16:52:02
698
原创 使用 PyTorch 框架对 CIFAR - 10 数据集进行CNN分类
【代码】使用 PyTorch 框架对 CIFAR - 10 数据集进行CNN分类。
2025-09-26 15:00:38
996
原创 关于图像分类的训练模型与调优
TP+TN/TP+FP+TN+FN直观反映整体分类正确比例。TP/TP+FN衡量所有正类样本中,被正确识别出来的比例。2*P*R/P+R平衡精确率与召回率,适合类别不平衡场景。衡量预测为正类的样本中,真正为正类的比例。
2025-09-25 16:49:13
348
原创 深度学习基础
线性回归:用线性关系预测连续值,靠梯度下降优化,适合房价、股价等预测任务。Softmax 回归:在线性回归基础上加 Softmax 运算,输出概率分布,用交叉熵损失优化,适合手写数字识别、文本分类等任务。两者的优化逻辑、损失函数设计,也为学习卷积神经网络、循环神经网络等复杂模型打下基础,理解它们就能快速入门深度学习。
2025-09-17 16:35:18
565
原创 深度学习预知识
人工智能是用人工方法让机器具备类人智能,其学科则是研究模拟、延伸人类智能的理论、技术与应用系统的科学。需注意,仅能按预设程序计算的计算器不属于人工智能。
2025-09-16 16:06:41
995
原创 支持向量机
支持向量机(Support Vector Machine,SVM)是一种经典的监督学习算法,在分类问题中表现出色。它通过寻找最优超平面来实现对不同类别样本的划分,具有良好的泛化能力和对高维数据的处理能力。本文将详细介绍 SVM 的原理,并结合代码实现展示其应用。
2025-08-26 18:49:07
699
原创 朴素贝叶斯算法
朴素贝叶斯是机器学习中 “简单高效” 的代表算法,其核心优势在于训练 / 预测速度快、对小样本友好、过拟合风险低,尤其适合处理离散型数据(如文本)。通过本文的代码实现,读者可快速上手三种朴素贝叶斯模型;若需快速处理文本数据:优先选择多项式朴素贝叶斯;若需解释决策规则:优先选择决策树;若需最高准确率:优先选择随机森林;若需快速验证小样本任务:可尝试KNN。
2025-08-25 17:36:59
681
原创 线性回归模型
通过对 (E(w,b)) 分别求 w 和 b 的偏导,并令偏导数为 0,可解得最优参数: (w = frac{sum_{i=1}^m (x_i - bar{x})(y_i - bar{y})}{sum_{i=1}^m (x_i - bar{x})^2}) (b = bar{y} - wbar{x}) 其中,(bar{x}) 是特征 x 的均值,(bar{y}) 是真实值 y 的均值。测试集 (R^2) 通常在 0.7~0.8 之间,说明模型能解释约 70%-80% 的房价变异,拟合效果较好;
2025-08-22 18:03:48
1077
原创 集成 算法
1. 生成自定义数据集n_samples=300, # 样本数n_features=2, # 特征数(2维便于可视化)centers=4, # 真实聚类数cluster_std=0.6, # 类内方差(控制簇分散程度)random_state=42 # 固定随机种子,结果可复现print("数据集形状:", X.shape) # 输出:(300, 2)# 2. 初始化并训练K-Means模型n_clusters=4, # 聚类簇数(与真实中心数一致)
2025-08-21 17:01:41
392
原创 数据预处理
将数据映射到指定范围(默认 [0,1]),公式为:(X_{scaled} = frac{X - X_min/X_max - X_min)。根据阈值将连续数据分为 0 和 1 两类(如年龄 > 30 为 1,否则为 0)。支持均值、中位数、常数、众数 4 种填充策略,适用于机器学习流程中的数据预处理。(y,无顺序关系),将类别映射为 0 到 n_classes-1 的整数。(无顺序关系,如血型、性别),将 N 个取值转换为 N 维稀疏向量。(有顺序关系,如学历、成绩档次),保留顺序信息。
2025-08-20 17:00:57
377
原创 决策树二-泰坦尼克号幸存者
随着深度增加,训练集得分(红色曲线)持续上升(最高约 0.9132),但交叉验证集得分(蓝色曲线)在深度为 3-5 时达到峰值(约 0.8200),之后逐渐下降,说明深度超过 5 后模型开始过拟合。但该算法对可取值数目较多的属性存在偏好,例如 “编号” 这类唯一标识属性,可能被误选为最优划分特征,导致模型泛化能力下降。衡量数据集纯度,基尼指数越小,数据集类别越集中(纯度越高),其计算公式为(Gini(D)=1-\sum_{k=1}^{n}p_k^2\),其中(p_k)是数据集D中第k类样本的占比。
2025-08-19 17:54:42
1039
原创 算法-决策树
temperature中对应大当家sunny有hot(2个),mild(2个),cool(1个),当sunny对应hot时,特征为yes的有0个熵为0,sunny对应mild的有1个yes1个no,所以熵为1,SUNNY对应cool的有1个yes,所以熵为0,加权为:5/14(2/5*0+2/5*1*+1/5*0)=0.14,信息增益为:0.694-0.14=0.554。加权平均为:3/5*0.918+2/5*0=0.551。特征二熵为:-(2/4log2/4+2/4log2/4)=1,否的为0,
2025-08-18 15:42:42
512
原创 KNN算法
K 近邻算法是一种基于实例的 “懒惰学习” 算法,无需预先训练模型参数。其核心思想是:对于一个新样本,通过计算它与训练集中所有样本的距离,选取距离最近的 K 个邻居样本,新样本的类别由这 K 个邻居中出现频率最高的类别决定。
2025-08-15 19:38:49
655
原创 机器 学习
机器学习是人工智能的核心分支之一,其思想是让计算机通过对数据的分析和学习,自动发现规律,总结经验从而具备解决问题的能力。在2016年韩国首尔,我国机器人通过机器学习和算法等在围棋领域战胜了九段高手李世石。这足以表明机器学习的重要性。
2025-08-14 14:59:41
910
原创 数据分析总结
等等,我们还可以根据这个格式可视化出更多的东西,例如每个店铺平均每多少单有一个评论等等。可视化是我们的目的之一,我们主要是为了分析,做出来可视化我们也更好的去分析问题,例如,我在以后的双十一可以在11.09设置一个合理的价格。或者是以后我如果想开一个店铺的话我应该多进什么品牌的化妆品,主要针对人群是什么。例如:先观察销量,各店小类中销量最高的是相宜本草的补水类商品以及妮维雅的清洁类商品,这两类销量很接近。而销售额上,相宜本草的补水类商品比妮维雅的清洁类商品要高得多,这显然是商品平均单价不同所导致的。
2025-08-13 15:04:12
1391
原创 爬虫和数据分析相结合的案例
本案例从网页数据爬取入手,运用requests和beautifulsoup库获取并解析数据,接着使用pandas库处理缺失值,最后借助matplotlib和numpy库实现数据可视化。完整展示了数据处理流程,涵盖数据获取、清洗、分析及呈现,为数据科学相关实践提供了清晰范例,在实际应用中,可根据具体需求对代码进行优化扩展,如处理更多数据、改进可视化效果等。
2025-08-11 15:41:07
738
原创 matplotlib库和seaborn库
imsave():可以将生成的图像保存到指定的目录中。格式:sns.scatterplot()格式:sns.violinplot()格式:sns.lineplot()格式:sns.barplot()格式:sns.boxplot()格式:sns.heatmap()
2025-08-08 11:35:18
253
原创 Matplotlib函数绘制图像
Matplotlib 是 Python 中最流行的数据可视化库之一,用于创建高质量的2D图表和图形。它最初由 John D. Hunter 于2003年创建,现已成为 Python 科学计算生态系统的重要组成部分。
2025-08-07 15:51:02
664
原创 Pandas库的一些语言
1.将dataframe保存为excel文件。3.将 DataFrame 复制到剪贴板。18.条件替换(mask)2.从剪贴板读取数据。9.转换时间序列频率。11.时间序列重采样。
2025-08-06 14:46:05
167
原创 Numpy结尾以及Pandas库
定义:开源 Python 类库,用于数据分析、处理和可视化。特点:高性能、提供容易使用的数据结构和数据分析工具。
2025-08-06 09:48:01
909
原创 numpy广播
展平数组并返回拷贝(修改不影响原数组)。展平数组并返回视图(修改会影响原数组)。将数组广播到指定形状(返回只读视图)。数组元素迭代器,用于遍历所有元素。不改变数据,仅修改数组形状。对换数组维度(矩阵转置)。删除数组中的一维条目。滚动指定轴到新位置。
2025-08-01 13:49:54
591
原创 数据挖掘Numpy库
Ndarray(N-dimensional array,N 维数组)是 NumPy 中最核心的数据结构,它是一系列同类型数据的集合,以 0 下标为开始进行元素索引,能够高效地存储和处理多维数值数据。Ndarray 对象的内容可以通过索引或切片来访问和修改,与 Python 中列表的切片操作类似。Ndarray 的维度(也称为轴,axis)是其重要特性。指定存储顺序('C' 为行优先,'F' 为列优先)。创建指定形状的数组,数组元素以指定的。函数,用于创建一个等差数列的数组。参数从原数组中切割出一个新数组。
2025-07-31 18:10:28
1296
原创 beautifulsoup
BeautifulSoup 是一个用于解析 HTML 和 XML 文档的 Python 库,它能够将复杂的文档结构转换为易于操作的树形结构,从而简化数据提取过程。简洁的 Python 式接口:提供直观的函数用于导航、搜索和修改解析树,降低数据提取的复杂度。自动编码处理:自动将输入文档转换为 Unicode 编码,输出为 utf-8 编码,无需手动处理编码问题。灵活的解析策略:支持多种解析器,可根据需求在速度与容错性之间权衡。强大的容错能力。
2025-07-30 18:00:17
663
原创 # PyMySQL数据存储
在数据采集与处理中,将爬取的信息持久化存储到数据库是关键环节。MySQL 作为主流的关系型数据库,常与 Python 结合实现数据存储。本文基于 PyMySQL 库,从基础操作到实战案例,详细总结如何在 Python 中实现 MySQL 数据存储,包含完整代码示例与核心原理。
2025-07-29 17:41:55
572
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅