- 博客(54)
- 收藏
- 关注

原创 【理解机器学习中的过拟合与欠拟合】
定义:过拟合就是模型“学得太多了”,它不仅学会了数据中的规律,还把噪声和细节当成规律记住了。这就好比一个学生在考试前死记硬背了答案,但稍微换一道题就不会了。过拟合:模型对训练数据“学得太死”,测试数据表现很差。欠拟合:模型对数据“学得太少”,训练和测试表现都不好。
2024-12-24 00:15:00
3883
21
原创 《梯度消失和梯度爆炸:神经网络的“学习脾气”大揭秘》
在传统机器学习和神经网络的世界里,梯度消失(Gradient Vanishing)和梯度爆炸(Gradient Explosion)是两个让人头疼的“老大难”问题。它们听起来高大上,像是什么复杂的数学怪兽,但其实用大白话就能讲明白。想象你在教一个机器人学生读书,这家伙要么懒得动(梯度消失),要么一激动跑过头(梯度爆炸),结果就是学不好东西。今天,我就用最通俗的方式,带你彻底搞懂这两个问题是怎么回事,为什么会发生,以及科学家们是怎么“驯服”它们的。准备好了吗?咱们开始吧!要弄懂梯度消失和梯度爆炸,咱们得先搞清
2025-03-17 10:04:41
1187
8
原创 从 YOLOv1 到 YOLOv2:目标检测的进化之路
你有没有想过,当你用手机拍一张照片,里面的人、车、狗是怎么被自动识别出来的?这背后靠的就是。目标检测是计算机视觉中的一个重要领域,它不仅要回答“图片里有什么”,还要告诉你“这些东西在哪里”。和。它们的名字听起来很酷——“You Only Look Once”(你只看一次),不仅名字帅,性能也很强。这篇博客将带你走进 YOLO 的世界,聊聊它们的原理、区别,以及那些听起来高大上的概念,比如 mAP、FPS、IoU 等。我们会尽量用大白话解释,并在后面深入讲解数学公式和代码实现,让你轻松看懂!
2025-03-14 14:10:42
1201
3
原创 《Transformer如何进行图像分类:从新手到入门》
这篇博客将带你从零开始,了解Transformer的基本概念、它如何被应用到图像分类,以及通过一个简单的例子让你直观理解它的运作原理。假设我们要训练一个模型,区分CIFAR-10数据集中的“猫”和“狗”图片(CIFAR-10是PyTorch内置的一个小型图像数据集,包含10类32x32像素的图像)。让我们看看它是如何工作的。在最后一层,ViT取一个特殊的“分类标记”(CLS Token),通过全连接层输出10个类别的概率(CIFAR-10有10类),比如“猫”的概率是0.8,“狗”是0.1。
2025-03-13 17:43:18
1164
28
原创 《高效迁移学习:Keras与EfficientNet花卉分类项目全解析》
想象一下:如果一个已经会弹钢琴的人学习吉他,会比完全不懂音乐的人快得多。因为TA已经掌握了乐理知识、节奏感和手指灵活性,这些都可以迁移到新乐器的学习中。这正是迁移学习(Transfer Learning)的核心思想——将已掌握的知识迁移到新任务中。
2025-03-12 00:00:00
663
13
原创 【使用VGG进行迁移学习:超参数调节与优化技巧】
迁移学习(Transfer Learning)作为深度学习中的一种重要技术,已经广泛应用于各种视觉任务,如图像分类、目标检测等。通过利用在大规模数据集(如ImageNet)上训练的预训练模型,迁移学习能够显著提高模型在小数据集上的表现。VGG(Visual Geometry Group)是一个经典的卷积神经网络架构,广泛用于迁移学习。本文将详细介绍如何使用VGG进行迁移学习,并通过超参数调节提高模型的性能。
2025-03-11 15:06:07
705
1
原创 【多层堆叠集成模型(Stacking Ensemble)详解】
堆叠集成(Stacking,简称Stacking)是一种通过训练多个不同的基学习器(Base Learners),然后再将这些基学习器的预测结果作为新特征,交给一个新的学习器(称为元学习器,Meta Learner)进行训练的集成方法。堆叠集成可以看作是一个层叠结构,其中每一层包含一个或多个模型。
2025-03-11 13:50:39
887
1
原创 【 深入解析VGG网络:理论、调优与ResNet对比】
参数典型值作用解析学习率0.001~0.01控制权重更新步长,过大易震荡,过小收敛慢。RMSProp/Adam可自适应调整。批量大小32~256影响梯度估计的稳定性,小批量增加随机性但需要更多内存。优化器Momentum(β=0.9)加速收敛,Adam结合动量与自适应学习率,适合非凸优化。权重初始化He正态分布针对ReLU激活,初始化权重方差为 (2/n_{\text{in}}),缓解梯度消失/爆炸。正则化惩罚大权重,防止过拟合。Dropout(rate=0.5)随机屏蔽神经元,增强泛化能力。
2025-03-10 17:46:27
1094
2
原创 【深入解析Inception网络:从V1到V3的理论演进与对比,包含pytorch实现Inception模块的代码】
特性卷积分解无非对称卷积(1×3+3×1)归一化无批量归一化(BN)BN + 标签平滑优化器SGDSGD + 动量RMSProp模块设计基础Inception模块分解卷积+BN多类型模块(A/B/C)
2025-03-09 22:54:16
1283
2
原创 【OpenCV图像处理基础与OCR应用】
本文将带你从基础的图像处理开始,逐步了解OCR技术的原理,并结合OpenCV实现简单的OCR预处理流程。在这个过程中,图像中的文本部分需要被提取、清晰化并转换为二值图像,再通过OCR模型识别出文字。Tesseract是一个开源的OCR引擎,支持多种语言的文字识别。OCR中的图像二值化是将图像中的所有像素值转化为黑白两色,便于后续的字符识别。高斯模糊常用于去噪,它通过卷积运算对图像进行模糊处理,去除图像中的噪点。文档图像的OCR处理首先要进行图像的预处理,确保字符区域清晰且易于识别。1.2.2 高斯模糊。
2025-03-08 22:33:58
905
1
原创 【机器学习中的数据泄露:你必须知道的事】
简单来说,数据泄露就是在训练模型时,模型意外地获得了不该用的额外信息。这些信息通常是模型在预测过程中无法获取的“未来数据”或“目标信息”。一旦数据泄露发生,模型就会提前知道未来的答案,从而产生不真实的高准确率或性能表现。你可能会觉得这样没什么问题,反正模型的表现很好啊,但事实上,当这种泄露发生时,模型在真实环境中的表现通常会大打折扣,甚至完全失效。
2025-03-07 11:52:52
925
3
原创 【机器学习中的“模型穿越”问题:定义、解决方法】
本质:模型通过训练数据中的“未来信息”提前“偷看答案”,破坏了时间因果性。后果:模型在训练集和验证集上表现优秀,但在真实场景中失效,导致模型过拟合并无法有效泛化到未知数据中。例如,在金融预测、销量预测、股市分析等领域,模型穿越可能导致严重的预测偏差。
2025-03-07 11:27:27
1067
1
原创 【kaggle机器学习实战--降雨数据集的二分类建模,内含插值法和二分类各种评估指标的可视化详解】
通过对降雨数据集进行二分类建模,引出二分类中各种评估指标的计算和可视化,包括pr曲线,roc曲线,混淆矩阵,还拓展了插值法这个缺失值处理方法。
2025-03-06 10:07:36
1130
25
原创 深入解析EfficientNet:高效深度学习网络与ResNet的对比(使用TensorFlow进行代码复现,并使用cifar10数据集进行实战)
EfficientNet是一种由Google在2019年提出的深度神经网络架构,其目标是通过优化神经网络模型的深度、宽度和分辨率来实现计算效率和准确度的平衡。它的核心理念是:通过复合缩放(Compound Scaling)方法同时优化网络的深度、宽度和输入图像的分辨率,使得网络在给定计算预算下能够达到更高的性能。
2025-03-05 00:00:00
1651
19
原创 【深入OpenCV图像处理:从基础到实战应用】
在医疗影像分析、工业质检、自动驾驶等领域,OpenCV作为计算机视觉的基石工具,为图像处理提供强大支持。使用OpenCV VideoCapture实现实时视频处理。,系统讲解OpenCV核心功能,并深入解读参数配置原理。结合TensorFlow Lite开发移动端CV应用。在Kaggle数据集上复现经典CV案例。研究OpenCV源码优化关键算法。
2025-03-04 00:15:00
606
23
原创 【图像处理与OpenCV:技术栈、应用和实现】
OpenCV是一个开源的计算机视觉库,它包含了丰富的图像处理和计算机视觉功能,支持多种操作系统(如Windows、Linux、macOS)和开发语言(如C++、Python、Java等)。自1999年由Intel公司发布以来,OpenCV成为了世界上最流行的计算机视觉库之一。跨平台性:OpenCV支持Windows、Linux、macOS以及移动设备的开发,甚至包括Android和iOS。丰富的功能。
2025-03-03 17:31:36
1473
10
原创 【Keras图像处理入门:图像加载与预处理全解析】
本文将全面讲解如何使用Keras进行图像加载、预处理和数据增强,为深度学习模型准备高质量的图像数据。
2025-02-27 10:36:15
1720
29
原创 Python图像处理入门:如何打开图像文件及常见格式
Pillow:适合图像读取、处理和转换,支持多种格式。OpenCV:更强大的图像处理工具,适用于计算机视觉任务。Matplotlib:用于显示图像,结合其他图像处理库一起使用。:适合高阶图像处理。imageio:轻量级的图像读取和显示工具。每个库有其特点,选择最适合你的工具能让你更高效地进行图像处理。在了解如何加载图像之后,你将能进一步处理这些图像,用于神经网络训练和计算机视觉任务。希望这篇文章能帮助你更好地理解如何在 Python 中打开图像文件并进行处理。祝你在学习神经网络的路上取得进展!
2025-02-25 16:54:01
926
6
原创 XGBoost vs LightGBM vs CatBoost:三大梯度提升框架深度解析
graph TDA[数据规模] -->|>1M样本|B(LightGBM) A -->|<100K样本|C{特征类型} C -->|连续特征为主|D(XGBoost) C -->|类别特征多|E(CatBoost) B --> F{是否需要快速迭代}F -->|是| G(LightGBM+直方图) F -->|否| H(考虑CatBoost)三大框架各有千秋,实际应用中建议:优先使用LightGBM作为baseline类别特征超过30%时切换CatBoost。
2025-02-21 14:38:59
1419
4
原创 使用TensorFlow构建图像分类模型的入门指南
用户友好性:直观的API设计,适合快速原型开发模块化设计:像搭积木一样组合神经网络层多后端支持:支持TensorFlow、Theano和CNTK跨平台运行:支持CPU/GPU训练,可部署于服务器、移动端等。
2025-02-18 17:23:25
506
2
原创 【机器学习实战】kaggle背包价格预测--堆叠(获得铜牌代码)
分别为 LightGBM、XGBoost 和 CatBoost 定义了三个优化函数,每个函数都利用 Optuna 自动调整模型的超参数,选择最优超参数以便得到最小化的RMSE(均方根误差)作为评估指标。
2025-02-14 10:29:08
1988
22
原创 探索DeepSeek:开源大模型领域的中国力量
DeepSeek的成功印证了开放协作在AI发展中的关键作用。当更多开发者能在开源地基上建造创新应用,人工智能技术才能真正服务于全人类。这个来自中国的开源力量,正在为全球AI发展提供新的解题思路。
2025-02-13 17:48:51
846
3
原创 【深入探讨 ResNet:解决深度神经网络训练问题的革命性架构】
ResNet(Residual Networks)是由微软研究院的何凯明等人于2015年提出的神经网络架构。在深度神经网络中,随着层数的增加,网络的表现反而开始退化,这种现象被称为“退化问题”。为了缓解这个问题,ResNet引入了“残差块”(Residual Block)的概念。通过在网络中加入跳跃连接(skip connections),ResNet使得信息可以绕过一些层,直接传递到更深层,从而避免了梯度消失和梯度爆炸的问题。在传统的神经网络中,每一层的输出是当前输入的变换。
2025-02-12 17:30:46
1652
5
原创 【深度学习入门实战】基于TensorFlow的手写数字识别实战(附完整可视化分析)
本案例使用经典的MNIST手写数字数据集,通过Keras构建全连接神经网络,实现0-9数字的分类识别。
2025-02-11 10:06:32
1104
16
原创 从零开始的AI对话指南:5步掌握提示词工程精髓
提示词工程(Prompt Engineering)作为人机对话的核心技能,已成为数字时代的新型生产力工具。本文将带你系统掌握这项价值百万的对话技术。
2025-02-10 00:15:00
1221
原创 AI Prompt 提示词工程入门指南:新手小白快速上手
打造,帮助你快速掌握 Prompt 工程的基础,学会如何撰写高质量的提示词,让 AI 更精准地理解你的需求,并产出最优质的内容。你是一个资深 UI 设计师,向一个没有设计经验的人解释 Figma 和 Photoshop 的区别,并推荐适合新手的工具。当你掌握了基础的 Prompt 设计后,可以使用一些高级技巧,让 AI 的输出更加精准和符合需求。不同的 Prompt 会影响 AI 的回答质量,就像你问问题的方式不同,得到的答案也可能不同。让 AI 知道对话的背景和相关信息,以便生成更符合预期的答案。
2025-02-09 00:15:00
1183
1
原创 【一文搞懂几种常用推荐算法】
协同过滤:适合用户-物品交互数据丰富的场景。矩阵分解:能处理稀疏数据,适合显式评分预测。基于内容:依赖物品特征,解决冷启动问题。NMF:适用于非负数据(如点击率、购买记录)。根据实际需求选择算法,或结合多种方法构建混合推荐系统。
2025-02-08 11:37:21
1449
15
原创 【深度学习实战:kaggle自然场景的图像分类-----使用TensorFlow框架实现vgg16的迁移学习】
本次数据集来自kaggle,该数据集包括自然场景的图像。模型应该预测每个图像的正确标签。您的目标是实现分类问题的高精度。
2025-02-08 11:30:57
1126
原创 标签编码和独热编码对线性模型和树模型的影响
相信大家在建模中经常会用到标签编码和独热编码,这两种不同的编码方式到底会对模型产生什么影响,本期就使用kaggle贴纸销量预测的数据集针对这两种编码方式展开研究。让我们开始探索吧。
2025-01-22 15:23:09
1236
24
原创 【数据挖掘实战】 房价预测
本次竞赛有 79 个解释变量(几乎)描述了爱荷华州艾姆斯住宅的各个方面,需要预测每套住宅的最终价格。数据集描述本次数据集已经上传,大家可以自行下载尝试文件说明train.csv- 训练集test.csv- 测试集- 每列的完整描述,最初由 Dean De Cock 准备,但经过轻微编辑以匹配此处使用的列名称- 根据销售年份和月份、地块面积和卧室数量的线性回归提交的基准。
2025-01-21 15:02:49
1443
29
原创 【机器学习实战】kaggle 欺诈检测---使用生成对抗网络(GAN)解决欺诈数据中正负样本极度不平衡问题
【机器学习实战】kaggle 欺诈检测---如何解决欺诈数据中正负样本极度不平衡问题本篇文章是基于上次文章中提到的对抗生成网络,通过对抗生成网络生成少数类样本,平衡ok,话不多说,我们进入正题吧。
2025-01-17 16:18:00
1940
24
原创 【机器学习实战】kaggle 欺诈检测---如何解决欺诈数据中正负样本极度不平衡问题
*活动发起人本次分享的是我在参与kaggle信贷欺诈竞赛中的一些心得,希望供大家批评与交流,也希望能有金融欺诈方向的大佬能够在评论区或者私信中指导我。包含各种kaggle竞赛中的机器学习实战内容,并附有源码,希望大家多来交流。
2025-01-16 17:25:29
1177
9
原创 【深度学习实战】kaggle 自动驾驶的假场景分类
判断自动驾驶场景是真是假,训练神经网络或使用任何算法来分类驾驶场景的图像是真实的还是虚假的。图像采用 RGB 格式并以 JPEG 格式压缩。标签显示 (1) 真实和 (0) 虚假二元分类VGG16 是由牛津大学视觉几何组(VGG)在2014年提出的卷积神经网络(CNN)。它由16个层组成,其中包含13个卷积层和3个全连接层。其特点是使用3x3的小卷积核和2x2的最大池化层,网络深度较深,有效提取图像特征。VGG16在图像分类任务中表现优异,尤其是在ImageNet挑战中取得了良好成绩。
2025-01-15 16:17:58
1467
18
原创 【PyTorch入门】使用PyTorch构建一个简单的图像分类模型
本文章使用pytorch构建了一个简单的图像分类器,主要用于熟悉torch建模的流程。
2025-01-09 10:06:24
2840
14
原创 最全总结【时间序列】时间序列的预处理和特征工程
时间序列(Time Series)是按时间顺序排列的一组数据点,通常用于描述和分析随时间变化的现象。时间序列数据在许多领域中都有广泛应用,如金融市场、气象学、经济学、医学等。时间序列的预处理和特征工程是提高时间序列预测模型效果的关键步骤。通过对数据进行去趋势、去季节性、平稳化等预处理操作,可以有效减少噪声并突出数据的规律性。同时,通过滞后特征、滚动统计量、季节性特征等特征工程方法,可以更好地捕捉时间序列的动态变化。掌握这些技巧将帮助你在时间序列分析中取得更好的效果,为预测模型提供有力的支持。
2025-01-07 17:17:49
3246
8
原创 【PyTorch入门】 PyTorch不同优化器的比较
优化器原理优点缺点适用场景SGD随机梯度下降实现简单,计算开销小收敛慢,容易震荡基础任务,特别是小规模训练任务Momentum加入动量加速收敛,避免局部最小值动量参数选择困难适合梯度波动较大的任务AdaGrad自适应调整每个参数的学习率自动调整学习率,适合稀疏数据学习率逐步减小,可能导致训练后期收敛缓慢处理稀疏数据(如 NLP)RMSprop使用梯度平方的指数加权平均防止学习率过早减小,适合动态任务需要调节超参数适用于非平稳目标函数,尤其是 RNN 和时间序列任务Adam。
2025-01-04 00:15:00
2006
4
原创 程序员如何培养技术领导力
在现代技术发展的浪潮中,程序员不再仅仅是单纯的“代码执行者”,更有机会成为技术团队的领导者、项目的引领者以及技术蓝图的制定者。通过扎实的技术功底、团队协作精神、激励团队的能力以及战略眼光的培养,技术领导者不仅能够带领团队攻坚克难,还能为公司和行业的未来发展奠定基础。在项目的开发过程中,每个人的经验和思考方式都有不同,技术领导者要学会尊重团队成员的独特视角,并且引导大家充分讨论,提出更具建设性的方案。在项目的不同阶段,领导者可以组织技术分享会,分享自己在项目中的技术心得,帮助团队成员迅速掌握新技术、新方法。
2025-01-03 17:09:37
308
1
原创 【机器学习实战】kaggle playground最新竞赛,预测贴纸数量--python源码+解析
hello,本次分享kaggle playground最新竞赛,预测贴纸数量。目标:此挑战的目标是预测不同国家/地区的贴纸销量评估:使用平均绝对百分比误差 (MAPE)评估提交的内容。
2025-01-03 10:18:50
1413
原创 【pytorch练习】使用pytorch神经网络架构拟合余弦曲线
在本篇博客中,我们将通过一个简单的例子,讲解如何使用 PyTorch 实现一个神经网络模型来拟合余弦函数。本文将详细分析每个步骤,从数据准备到模型的训练与评估,帮助大家更好地理解如何使用 PyTorch 进行模型构建和训练。
2024-12-31 17:15:50
1116
3
【机器学习实战】kaggle背包价格预测(堆叠的实战用法)
2025-02-14
使用request爬取小说简单案例
2025-01-22
【数据挖掘实战】 房价预测
2025-01-21
【机器学习实战】kaggle 欺诈检测-如何解决欺诈数据中正负样本极度不平衡问题
2025-01-16
《机器学习实战》-机器学习领域的Python实践指南:涵盖基础理论与实战项目
2025-01-06
【机器学习实战】kaggle playground最新竞赛,预测贴纸数量-python源码+解析
2025-01-03
数据分析领域Pandas基础操作及应用技巧
2024-12-31
该数据集提供了丰田汽车公司(股票代码:TM)从1980 年到2024 年的每日股票交易数据,来源于雅虎财经 它提供了丰田汽车四十多年来股票表现的广泛记录,包括调整收盘价、开盘价/收盘价等
2024-12-31
这个数据集是一个专为初学者设计的图像分类数据集,旨在帮助学习者掌握深度学习中的图像识别任务 数据集包含了大量关于碟子是否干净或脏的图像,经过精确的标签标注,确保每一张图像都得到了正确的分类
2024-12-31
【机器学习实战】 kaggle贷款批准预测 (使用xgboost解决正负样本不平衡问题)
2024-12-27
【机器学习实战】 kaggle二手车的价格预测,非常适合新手和初学者练习特征工程和数据处理
2024-12-26
机器学习实战:结合随机森林(RF)与递归特征消除和交叉验证(RFECV)进行精准特征选择,使用LightGBM与过采样技术应对极度不均衡的正负样本,并通过SHAP进行模型解释的电信客户流失预测
2024-12-23
【kaggle深度学习实战-保险数据集的回归-基于pytorch-Regression with an Insurance Dataset】
2024-12-20
机器学习实战kaggle-House Prices - Advanced Regression Techniques (房价高级回归)
2024-12-19
kaggle入门级竞赛Spaceship Titanic LIghtgbm+Optuna
2024-12-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人