自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(43)
  • 收藏
  • 关注

原创 图像分割!

图像分割是一种像素级分类技术,主要用于轮廓预测和物体识别。其核心是将图像像素划分为不同类别,应用于人像抠图、医学影像、自动驾驶等多个领域。根据任务要求,分割可分为三个层次:语义分割(类别标注)、实例分割(个体区分)和全景分割(全像素覆盖)。主流数据集包括VOC(20类物体)和Cityscape(城市场景),为模型训练提供标准标注数据。这些技术在计算机视觉领域具有广泛应用价值。

2025-10-29 15:48:54 291

原创 Train

本文介绍了YOLOv5目标检测模型的训练脚本,主要包含以下功能:1) 支持命令行参数配置训练参数;2) 集成数据加载、模型初始化、训练控制和性能评估全流程;3) 提供多卡训练、预训练加载和超参数进化等高级功能;4) 采用优化器分组、学习率调度、混合精度训练等技术提升训练效果。该脚本通过模块化设计实现了灵活的训练配置,支持多种训练策略和分布式训练,适用于目标检测任务的快速实验与部署。

2025-10-28 14:50:58 905

原创 YOLO!!

YOLO目标检测系统由三个核心模块组成:common.py定义基础网络组件(卷积模块、特征提取结构和后处理模块);yolo.py构建整体网络架构,实现检测头解码和模型工具函数;train.py完成训练流程,包括数据处理、优化策略和模型评估。系统采用多种优化技术如混合精度训练、多尺度输入和EMA参数平滑,形成从网络构建到训练部署的完整解决方案,兼顾模型性能和推理效率。

2025-10-27 16:26:09 519

原创 Label Smoothing

标签平滑技术通过将硬标签转换为软标签,有效缓解神经网络过度自信问题。具体实现中,原始二分类标签(0,1)经公式计算后变为(0.05,0.95),避免非0即1的绝对化。这种方法使模型提取的特征呈现更优分布:同类特征更紧密,不同类特征更分离,显著提升了模型的泛化能力。

2025-10-22 16:13:59 160

原创 YOLOv4 核心内容笔记

YOLOv4通过多项创新优化目标检测性能:采用双向特征融合的PAN网络解决FPN的底层特征传递不足问题;引入Mish激活函数增强特征表达能力;通过消除网格敏感性提升边界目标定位精度。其架构整合CSPDarknet、SPP、PAN等模块,实现高效特征提取与融合,同时保持单GPU训练可行性。这些改进在轻微增加计算成本下显著提升检测精度,特别适用于复杂场景和小目标检测。

2025-10-21 13:44:31 610

原创 YOLOv4 核心内容笔记

YOLOv4是一款高效的目标检测模型,在速度和精度上取得平衡。核心优势包括:单GPU即可训练,降低硬件门槛;通过数据增强(Mosaic、DropBlock等)和网络结构优化(CSPNet、注意力机制)双维度提升性能;采用改进的损失函数(CIOU)和NMS算法优化检测效果。实验验证充分,在实时检测任务中表现优于YOLOv3等模型。

2025-10-21 13:40:05 885

原创 YOLO-V1 与 YOLO-V2

YOLO系列目标检测模型演进摘要:YOLO-V1开创了one-stage检测方法,通过单CNN网络实现端到端检测(7×7网格输出),虽速度快但精度不足。YOLO-V2针对性地改进:引入BN层、高分辨率训练、DarkNet网络、Anchor Boxes和细粒度特征融合,mAP从63.4提升至78.6,同时保持实时性。关键创新包括聚类生成先验框、定向位置预测和多尺度训练,显著提升了小目标检测和模型泛化能力。两代模型展现了从基础架构到优化策略的完整演进路径。

2025-10-16 13:44:21 817

原创 使用 PyTorch 实现 MNIST 手写数字识别

本文演示了使用PyTorch构建并训练MNIST手写数字识别神经网络的全过程。主要包括:数据下载与预处理(使用transforms进行张量转换和标准化)、神经网络模型构建(包含两个隐藏层和批归一化)、训练流程实现(动态调整学习率、SGD优化器配合动量)、以及训练结果可视化。通过20个epoch的训练,模型准确率逐步提升,损失函数持续下降,验证了模型的有效性。文章还展示了如何利用TensorBoard记录训练过程,为深度学习项目提供了完整的实现范例和关键知识点总结。

2025-10-13 13:59:15 416

原创 图像分类项目

本文系统阐述了图像分类的核心概念与实践方法。首先将图像分类分为三个层次:通用多类别分类、细粒度子类分类和实例级分类。重点解析了分类性能评估体系,包括混淆矩阵、准确率/精确率/召回率/F1值等核心指标及P-R曲线可视化工具。针对模型结构,深入分析了网络深度(层数)与宽度(通道数)的定义与作用。针对小样本问题,提出迁移学习和数据增强(有监督/无监督)两大解决方案。文章强调需综合分类粒度、评估指标、模型结构和数据问题四个维度进行系统设计,尤其在不均衡场景下需合理选择评估方法并善用小样本处理技术。

2025-09-25 14:17:07 721

原创 PyTorch 数据处理工具箱

PyTorch数据处理与可视化工具链包含三大核心组件:1. 基础数据加载(utils.data):通过Dataset类构建自定义数据集,DataLoader实现批量加载、数据打乱等功能;2. 图像处理专用工具(torchvision):提供transforms预处理流水线(裁剪/翻转/标准化等)和ImageFolder多目录图像自动加载;3. 训练可视化(TensorBoard):支持损失曲线、模型结构、特征图等关键信息的可视化监控。典型工作流程为:定义Dataset→构建DataLoader→设计图像增强

2025-09-24 14:44:59 975

原创 PyTorch 神经网络构建与训练笔记

PyTorch构建神经网络主要有三种方式:1)直接继承nn.Module基类,手动定义网络层和传播逻辑;2)使用nn.Sequential容器按顺序构建模型,适合简单线性结构;3)结合nn.Module和模型容器(如nn.Sequential、nn.ModuleList、nn.ModuleDict)实现灵活结构化建模。文章以残差块为例展示了自定义模块的方法,并详细说明了模型训练流程,包括数据加载、损失函数定义、优化器选择、训练/验证循环等核心步骤,最后强调可视化分析对评估模型性能的重要性。

2025-09-23 13:37:16 820

原创 PyTorch神经网络工具箱

神经网络核心组件包括层、模型、损失函数和优化器。构建方法主要使用nn.Module和nn.functional两类工具,前者自动管理参数,后者更接近纯函数。可采用继承nn.Module、使用nn.Sequential或结合模型容器等方式构建网络。以ResNet为例,介绍了基础残差块和下采样残差块的设计。模型训练流程包括数据准备、定义损失函数和优化器、迭代训练与验证等步骤。不同构建方法各有特点,可根据需求选择合适的方式实现端到端的深度学习模型。

2025-09-22 12:33:18 644

原创 卷积神经网络

本文系统介绍了卷积神经网络(CNN)的发展与原理。首先分析了全连接层处理图像问题时的局限,包括空间信息丢失和参数量爆炸。随后详细解析CNN的两大核心原则(平移不变性和局部性)及其基础操作(卷积层、填充步幅、多通道处理等)。文章重点阐述了经典CNN架构:开创性的LeNet(1995)、里程碑式的AlexNet(2012)及其创新(ReLU、丢弃法),以及VGG网络的"更深更窄"设计。最后探讨了CNN的分层特征学习机制,从浅层边缘特征到高层语义特征的自动提取过程,展现了CNN从基础架构到深度

2025-09-19 13:55:20 899

原创 多层感知机

感知机是1957年提出的二分类模型,通过权重和偏差实现线性分类,但无法处理异或等非线性问题。多层感知机(MLP)引入隐藏层和激活函数(Sigmoid、ReLU等)解决了这一局限,成为基础神经网络。其训练通过前向传播和反向传播调整参数,需注意过拟合/欠拟合问题。模型评估采用K折交叉验证,关键优化方法包括权重衰减和暂退法。MLP通过非线性变换扩展了感知机的应用范围,是多分类任务的基础架构。

2025-09-18 13:54:25 455

原创 线性回归与Softmax回归核

摘要:本文系统介绍了线性回归和Softmax回归两种机器学习模型。线性回归适用于房价预测等连续值预测任务,通过最小化平方损失函数并采用梯度下降优化参数。Softmax回归是多分类模型,通过Softmax运算将输出转为概率分布,使用交叉熵损失函数优化。两者均可视为单层神经网络,区别在于输出处理方式:线性回归直接输出连续值,Softmax回归输出类别概率。文章还对比了不同损失函数的特性及适用场景。

2025-09-17 14:16:03 893

原创 深度学习预备知识

本文系统梳理了人工智能领域的核心内容:1)职业需求方面,详细列举了深度学习工程师和AI算法工程师所需的机器学习理论、编程框架及实践能力;2)技术发展层面,回顾了工业文明到AI时代的演进历程,阐释AI定义;3)应用场景方面,展示了智能家居、金融支付等日常AI应用及机器学习实现原理;4)核心知识模块,重点解析了数据、模型、目标函数等机器学习关键组件,区分监督/无监督/强化学习类型;5)深度学习的成功案例,包括图像分类、机器翻译等突破性进展及2012-2017年重要里程碑;6)补充图灵测试等基础概念。全文多维度呈

2025-09-17 13:44:01 705

原创 支持向量机(SVM)核心笔记

支持向量机(SVM)是一种监督学习算法,其核心目标是找到一个最优划分超平面,使不同类别样本间的间隔最大化。通过引入拉格朗日乘子法将原始优化问题转化为对偶问题求解,并采用支持向量确定超平面位置。为提升模型泛化能力,SVM引入软间隔处理噪音数据,通过核函数将低维不可分数据映射到高维空间实现线性可分。关键步骤包括:求解拉格朗日乘子、计算超平面参数、选择支持向量等。SVM具有优异的分类性能,在解决非线性可分问题时表现出色。

2025-08-26 14:20:41 563

原创 朴素贝叶斯学习笔记

摘要:贝叶斯方法由英国数学家托马斯·贝叶斯提出,通过先验概率和条件概率解决逆向概率问题。朴素贝叶斯算法假设特征独立,简化条件概率计算,广泛应用于拼写纠正、垃圾邮件分类等场景。常见的三种朴素贝叶斯模型包括:适用于离散数据的多项式模型、连续数据的高斯模型和二值特征的伯努利模型。在scikit-learn中,这些模型提供fit、predict、score等方法进行训练、预测和评估。

2025-08-25 13:52:14 582

原创 线性回归学习笔记

摘要:线性回归是一种通过属性线性组合预测连续值的模型,适用于房价预测等回归任务。其核心是最小二乘法,通过最小化均方误差求解最优参数。模型评估常用决定系数R²,衡量模型对数据变异的解释能力。Python中可通过sklearn快速实现,包括数据加载、预处理、模型训练和评估等步骤,如波士顿房价预测案例展示了从数据到模型评估的完整流程。关键指标包括MSE和R²,帮助判断模型拟合效果。

2025-08-22 23:45:00 533

原创 集成算法学习笔记

加权平均法:对回归任务,给不同个体学习器分配不同权重(通常精度高的权重更大),加权求和得到最终结果(公式:H(x) = \sum_{i=1}^{n} \omega_i h_i(x),其中\omega_i为第i个学习器的权重,且\omega_i \geq 0、\sum_{i=1}^{n} \omega_i = 1)。从“弱学习器”(精度略高于随机猜测的模型)开始,通过动态调整样本权重和学习器权重,逐步加强模型能力,最终将多个弱学习器串联成“强学习器”。设为True时,等同于简易交叉验证,无需额外划分验证集。

2025-08-22 23:30:00 417

原创 数据预处理学习笔记

本文介绍了数据预处理中的四种关键技术:1.缺失值处理(识别、删除和填充方法,包括Pandas和Scikit-learn工具);2.数据标准化(最大最小值标准化和Z值标准化);3.特征编码(独热编码、序号编码和标签编码);4.数据二值化(基于阈值的离散化方法)。这些方法可有效处理数据质量问题,为后续分析建模提供规范化数据。

2025-08-22 19:16:35 407

原创 决策树进阶学习笔记

本文介绍了决策树的核心算法与实现要点。主要内容包括:1)经典算法(ID3基于信息增益、C4.5改进为信息增益率、CART采用基尼系数);2)连续值处理通过二分法离散化;3)剪枝策略分为预剪枝(生长时限制)和后剪枝(全树修剪);4)Python实现参数说明(如criterion、max_depth等)。重点解析了各算法的特征选择标准、优缺点及防止过拟合的方法,为决策树应用提供技术指导。

2025-08-22 19:06:43 622

原创 决策树学习笔记

决策树是一种基于特征判断的树形模型,通过根节点到叶子节点的逐步判断实现分类或回归。其核心在于训练阶段的特征选择和切分方式确定,使用熵和信息增益作为衡量标准。熵反映数据不确定性,信息增益表示特征降低不确定性的能力。实例分析14天打球数据,通过计算各特征(如天气)的信息增益选择最优特征构造决策树。测试阶段只需沿树结构判断即可。决策树的关键在于合理选择特征切分点,使数据类别更集中。

2025-08-22 19:03:20 386

原创 K近邻算法(KNN)学习笔记

本文介绍了KNN(K近邻)算法的基本原理与应用。KNN是一种监督学习分类算法,通过计算待分类样本与训练样本的距离,选取k个最近邻进行投票决策。文章详细阐述了算法流程、k值选择对结果的影响,以及欧式距离和曼哈顿距离两种常用度量方法。通过鸢尾花分类和电影类型预测两个实例,演示了KNN算法的实际应用,包括数据准备、模型训练和评估等步骤。最后指出KNN无需提前训练模型,但需注意k值选择和特征标准化等问题。该算法简单直观,适用于小规模数据集分类任务。

2025-08-15 13:25:53 814

原创 机器学习笔记

机器学习是让机器通过经验数据自动改进任务性能的技术,包括监督学习(分类/回归)和无监督学习(聚类等)。核心概念包括数据集、特征、训练/测试集。模型评估需关注泛化能力,避免过拟合(增加数据、降维)和欠拟合(增加特征)。常用评估方法有留出法和交叉验证法,指标包括查准率和查全率(P-R图分析)。奥卡姆剃刀原则强调选择简单有效的模型。

2025-08-14 14:03:09 526

原创 双十一淘宝美妆数据分析笔记

本文分析了2016年双十一淘宝美妆数据(27,598条记录),发现:亲民品牌相宜本草销量和销售额最高,护肤品(清洁类、补水类)占主导地位。男士产品占比不足10%,但潜力较大。双11当日销量下滑,预热期(9日)达峰值。异常数据发现相宜本草评论效率异常(28单/条),可能存在刷单行为。整体显示低价策略更易获高销售额,护肤品市场优势明显。

2025-08-12 15:07:22 871

原创 数据科学与计算:爬虫和数据分析案例笔记

本文介绍了爬取和分析中国大学排名的完整流程。首先通过requests和BeautifulSoup爬取高三网上的大学排名数据,提取学校名称、总分、排名等关键信息并保存为CSV文件。随后使用pandas处理缺失值,包括删除空值、填充均值或中位数等方法。在数据分析环节,统计了820所高校的星级分布情况,并利用matplotlib绘制了柱形图和饼图直观展示不同星级高校的占比。案例完整呈现了从数据采集、清洗到可视化的全流程,为教育数据分析提供了实用参考。

2025-08-12 14:36:30 904

原创 Seaborn 学习笔记

Seaborn是基于Matplotlib的Python数据可视化库,专注于统计图形绘制。它提供简洁的高级接口和美观的默认主题,支持通过少量代码实现复杂可视化。安装可通过pip或conda完成,导入后可使用set_theme()设置风格(darkgrid/whitegrid/dark/white/ticks)和适用场景(paper/notebook/talk/poster)。主要绘图函数包括:散点图(scatterplot)、折线图(lineplot)、柱形图(barplot)、箱线图(boxplot)、热图

2025-08-08 12:16:11 332

原创 Matplotlib 学习笔记

本文整理了Matplotlib绘图库前70页学习笔记,主要内容包括:1)Matplotlib简介与安装方法;2)基本绘图函数plot()的使用及参数设置;3)图表标记样式、线条样式和颜色的详细配置方法;4)坐标轴标签、标题和网格线的设置;5)多子图subplot()的绘制;6)常用图表类型(散点图、柱状图、饼图、直方图)的绘制方法及参数说明。笔记通过代码示例展示了各种图表的基本绘制流程和样式定制技巧,为Python数据可视化提供了实用参考。

2025-08-07 14:48:00 1030

原创 Pandas 学习笔记

本文介绍了Python数据分析库Pandas的基本使用。主要内容包括:1)Pandas定义及特点,作为高性能的数据分析工具库;2)安装与导入方法,推荐使用清华源加速下载;3)核心数据结构Series和DataFrame的创建与操作,包括多种创建方式;4)数据查询方法,如loc()函数的使用;5)常见数据文件(csv、excel等)的读取方法及head()、tail()、info()等常用函数。文章通过代码示例展示了Pandas在数据处理中的基础应用,适合数据分析初学者快速入门。

2025-08-05 11:43:15 918

原创 数据科学与计算(NumPy 核心操作)笔记

NumPy是Python科学计算的核心库,支持多维数组和矩阵运算,为数据科学提供基础支持。其核心功能包括数组广播(自动处理不同形状数组的运算)、多种迭代方式(行序/列序遍历)、数组形状修改(reshape/flatten/ravel等)、维度操作(转置/翻转/扩展/压缩)、数组连接(concatenate/stack等)与分割(split/hsplit/vsplit),以及元素增删(append/insert/delete/unique)。这些功能使NumPy成为高效处理数值数据的强大工具,广泛应用于数据分

2025-08-01 13:41:25 961

原创 NumPy 学习笔记

本文介绍了Python科学计算库NumPy的基础知识,包括其核心功能、安装方法、核心数据结构Ndarray及其创建方式。NumPy通过高效的数组操作简化科学计算,支持多维数组和矩阵运算。文章详细讲解了多种创建数组的方法(如array()、zeros()、arange()等)、随机数生成函数以及数组的基本属性(如shape、dtype)。还介绍了数组的切片和索引操作,包括多维数组的访问方式。这些内容是数据科学和机器学习领域的基础工具。

2025-07-31 16:02:15 690

原创 BeautifulSoup 数据解析笔记

BeautifulSoup是Python中强大的HTML/XML解析库,支持多种解析器(如lxml、html5lib),提供标签导航、内容提取、数据修改等功能。核心功能包括自动编码转换、灵活的解析策略和简单的API接口。安装方式为pip install bs4,支持标签名、属性、文本内容等基本元素提取,以及find_all()、find()等方法选择器,还能通过CSS选择器精准定位元素。实战应用包括爬取网页表格数据(如大学排名)和新闻列表,数据可保存为CSV格式。

2025-07-30 14:42:54 723

原创 PyMySQL 数据存储

本文介绍了使用PyMySQL库操作MySQL数据库的方法。主要内容包括:1)关系型数据库基本概念;2)PyMySQL安装与连接配置;3)数据库操作四步骤:建立连接、获取游标、执行SQL、提交事务;4)核心对象方法说明;5)MySQL表操作实现(建表、增删改查);6)两个实战案例:豆瓣图书和安居客二手房数据存储。最后布置了实现豆瓣图书案例和封装通用数据库操作函数的作业任务。文章提供了完整的代码示例,适合Python开发者学习数据库操作。

2025-07-29 16:20:29 593

原创 MySQL数据库基础笔记

本文系统介绍了MySQL数据库的基础操作知识,主要包括数据操纵(INSERT/UPDATE/DELETE)、SELECT查询、条件筛选、聚合函数、多表合并和连接查询等核心功能。重点解析了SELECT语句的执行顺序、条件查询运算符、分组聚合(GROUP BY/HAVING)、UNION合并规则以及内连接/外连接的实现方式。同时详细说明了子查询的分类和使用场景,包括单行/多行子查询和EXISTS判断。全文以语法结构和注意事项为主线,为掌握MySQL基础操作提供了清晰的框架指引。

2025-07-25 13:34:18 1061

原创 MySQL数据库基础笔记

MySQL数据库基础笔记摘要: 数据库概念:包括数据库(DB)、数据库管理系统(DBMS)及其分类(关系型RDBMS如MySQL、非关系型NoSQL) MySQL简介:流行的开源关系型数据库,适合中小型应用 安装配置:详细说明下载、安装、环境变量配置及验证流程 SQL语言:DDL(定义)、DML(操作)、DQL(查询)、DCL(控制)四大组成部分及常用命令 数据类型与约束:字符、数值、日期等数据类型及主键、外键等约束条件 数据定义操作:CREATE/ALTER/DROP语句的语法和使用示例 (149字)

2025-07-24 14:06:28 673

原创 爬虫应用开发笔记

本文介绍了爬虫开发中Requests库的高级用法和XPath技术。Requests部分涵盖会话管理、文件上传、SSL验证和代理设置,通过示例代码演示了具体实现。XPath部分详细解析了节点选取规则、常用函数及etree模块应用,包括HTML解析、多路径查询等技巧。最后通过三个实战案例(人邮图书、酷狗音乐榜、起点中文网)演示了完整爬取流程,从网页请求、数据解析到CSV存储。作业要求分组爬取人邮教育网站5页图书数据,巩固XPath定位和Requests应用能力。全文提供了从基础到实战的爬虫开发指南。

2025-07-23 14:49:59 1630

原创 网络爬虫引发的问题

本文摘要:笔记涵盖爬虫开发与JavaScript基础两大主题。在爬虫部分,详细介绍了Robots协议的应用(包括规则、访问流程及遵守建议)以及数据存储方案(TXT/CSV文件操作及数据库选择)。JavaScript部分解析了语言特性(弱类型、平台无关性)、三种引入方式(行内/内部/外部)、变量定义(var关键字)、6种数据类型及流程控制结构(顺序/选择/循环)。文中特别强调爬虫需注意法律风险与隐私保护,并提供了CSV文件处理的标准库和pandas库两种实现方案。

2025-07-22 12:45:34 1400

原创 HTML开发基础及CSS笔记

HTML与CSS基础笔记摘要 本文总结了HTML和CSS的基础知识。HTML部分包括文字修饰标记(如粗体、斜体、上下标)、表格标记(table/tr/td属性)、表单标记(input类型及form属性)、列表标记(ul/ol)和常用元素(div/span)。CSS部分介绍了三种引入方式(内联/嵌入/外联)、基本语法结构(选择器+声明)、颜色表示方法、常用选择器(全局/标签/类/ID/伪类)以及核心属性(字体/背景/表格)。同时讲解了盒子模型(content-padding-border-margin)和元素

2025-07-21 13:40:44 1002

原创 HTML开发基础笔记

本文介绍了HTML开发的基础知识,主要包括:1.HTML是超文本标记语言,可嵌入多媒体内容和超链接;2.HTML文档由<html>、<head>、<body>组成,使用双标签和单标签;3.常用标记包括标题<h1>-<h6>、段落<p>、换行<br>、水平线<hr>等;4.文字修饰标记如<b>、<i>、<u>等;5.列表分有序<ol>和无序<ul>;6.超

2025-07-18 13:26:08 466

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除