自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(77)
  • 收藏
  • 关注

原创 【深度学习】03-神经网络 3-3 梯度下降的优化方法-动量算法Momentum

动量算法是一种改进的梯度下降方法,通过引入“动量”来减少震荡、加速收敛,并避免陷入局部最优解。通过结合当前和过去的梯度更新,动量算法能够有效改善传统梯度下降的缺陷,尤其在神经网络训练中表现优异。Nesterov 动量是动量算法的一种改进变种,能够进一步加速收敛,尤其在较为复杂的损失函数表面。%5Ctheta。

2024-09-24 09:41:13 2587

原创 从零开始构建 Transformer:完整代码、原理解析:《Attention Is All You Need》

本文全面解析了 Transformer 模型的原理与实现,详细介绍了模型背景、核心技术、各模块设计及代码实现。文章从词嵌入、位置编码、注意力机制、多头注意力、前馈网络、层归一化到残差连接,逐层剖析 Transformer 模型的设计思路,并提供了完整的 PyTorch 代码实现。文中还讨论了掩码生成和参数初始化的细节,为读者深入理解 Transformer 模型及其优化提供了实战指南。无论你是 NLP 新手还是深度学习专家,都能从中获得启发,助力你在实际项目中成功应用 Transformer 模型。

2025-03-30 00:45:03 673

原创 模型剪枝代码详解

模型减枝

2025-03-14 00:21:44 86

原创 知识蒸馏代码详解

T 让数据更加平滑,大的值缩小,小的值变大,T越大,越平滑。

2025-03-13 03:11:54 193

原创 【深度学习CV】【图像分类】从CNN(卷积神经网络)、ResNet迁移学习到GPU高效训练优化【案例代码】详解

本文详细介绍了三种不同的方法来训练卷积神经网络进行 CIFAR-10 图像分类任务,帮助读者从零开始学习如何设计和优化深度学习模型。首先,我们通过手工设计一个卷积神经网络并进行训练,讲解每个层次的作用和设计思想;接着,我们使用一个开源模型 ResNet34,并对其进行微调以适应我们的数据集;最后,我们通过一系列高效的训练技巧,显著提高训练效率,减少训练时间。最终,您将不仅能实现这一目标,而且能够举一反三,设计自己的模型,提升模型效率。

2025-03-06 00:00:16 1185

原创 【卷积神经网络】【图像分类】【实战案例】全流程图像分类实战:手工设计CNN、ResNet迁移与高效训练优化详解

有人说为什么不用yolo v8,yolo v10系列。

2025-03-05 23:58:16 99

原创 web3.0简介

Web3.0 是基于区块链及相关技术打造的全新互联网架构,旨在通过去中心化和开放性的方式,将数据、身份和数字资产的控制权还给用户,从而打破传统平台的垄断。这一概念不仅涉及去中心化金融、NFT、DAO 和元宇宙等热门领域,同时也面临扩展性、用户体验及监管等挑战。虽然 Web3.0 目前仍处于发展初期,但它已经引发了全球科技、投资和学术界的广泛关注,被视为可能重塑未来互联网的重要方向。

2025-03-02 23:56:48 1177

原创 Vim 常用快捷键大全:跳转、编辑、查找替换全解析

Vim 是一款非常强大的文本编辑器,许多程序员和系统管理员都离不开它。本文详细介绍了 Vim 编辑器中的常用快捷键和命令,从基本模式、光标移动、编辑操作到查找替换,再到文件保存等常用操作,帮助你快速上手并提升编辑效率。无论你是 Vim 新手还是资深用户,都能从中找到提升效率的技巧。阅读本文后,你将熟悉 Vim 的各种操作,让编程、写作变得更加高效!

2025-03-02 21:23:42 697

原创 在 macOS 使用 .pem 私钥免密登录腾讯云服务器

本文详细介绍了如何在 macOS 系统中使用腾讯云下发的 .pem 私钥文件进行 SSH 免密登录。内容涵盖了如何将私钥文件安全地放置到 ~/.ssh/ 目录、设置适当的文件权限、使用私钥连接远程服务器以及如何配置 SSH 配置文件简化登录流程。此外,文章还解答了使用过程中常见的问题,如为什么需要 chmod 400、私钥文本内容的解释、以及 Windows 环境下的转换问题等。希望通过本文,读者能够快速掌握密钥对登录的相关操作,提升云服务器管理的安全性与效率。

2025-03-01 22:39:23 1026

原创 【深度学习】【文本生成】循环神经网络案例讲解-基于 PyTorch 的中文歌词生成——RNN,LSTM,GRU 从数据预处理到预测全流程详解

本文详细介绍了如何利用 PyTorch 构建一个简单的中文歌词生成系统。文章从数据预处理、词表构建、数据集与 DataLoader 制作,到基于 RNN 的模型搭建、训练及预测全过程进行了讲解。同时,对项目中可能的改进方向如使用 LSTM/GRU、多层 RNN、采样策略等进行了讨论。本文适合有一定深度学习基础、希望快速上手文本生成任务的同学参考学习。

2025-02-28 23:21:07 1472 1

原创 【深度学习】循环神经网络(RNN)及其改进:LSTM 与 GRU 代码实践以及常见问题

本文详细介绍了循环神经网络(RNN)在处理长序列时存在的梯度问题,并重点解析了 LSTM 与 GRU 的改进原理。通过对比 RNN、LSTM 与 GRU 的结构、输入输出形式以及训练和预测过程中的差异,帮助读者更好地理解它们在捕捉长程依赖和稳定训练方面的优势。同时,文章还讨论了如何通过梯度裁剪、合理初始化等方法修复梯度爆炸问题。

2025-02-28 22:48:52 995

原创 赚钱的事与值钱的事

如同,比尔的供水系统,在拧开水龙头,清水流出之前,他所面对的,是日复一日的现金消耗,以及所有人对他的无尽质疑——我们到底能不能完成这件事,接通水,赚到钱?过去的半年时间里,他做了商业计划,找到了投资,注册了公司,并雇用了项目施工管理的专业人员。但是,你赚钱的时候,别人在设计一个更大的结构覆盖你,当比尔的水管接通,艾德愤怒妒恨哭天抢地找村长都是没用的。从投资人角度看比尔的水管,要基于对市场需求与供給能力、成本结构、市场变化概率的评估后,进行估值、投资,然后建设、收益分成。赚钱的事的核心,是当下的利差。

2025-02-26 23:40:38 214

原创 【深度学习】【多分类】神经网络多分类任务的一站式解决方案!从数据预处理到结果解析,手把手教你做手机价格预测

本文将从零开始构建一个多分类的 PyTorch 项目,以预测二手手机的价格区间。我们会详细介绍数据集构建、模型设计、模型训练、模型评估等流程,并结合可视化(如混淆矩阵、分类报告)来剖析模型效果。最后,还给出多种可行的改进方法(如使用 Adam、增加网络深度、标准化数据等),帮助你快速提升模型表现。

2025-02-26 22:24:06 911

原创 【机器学习】【KMeans聚类分析实战】用户分群聚类详解——SSE、CH 指数、SC全解析,实战电信客户分群案例

本文通过用户分群案例,详细介绍了如何使用 KMeans 聚类算法对客户数据进行分群,并结合 SSE(肘部法)、Calinski-Harabasz 指数和 Silhouette Score 三个指标来判断最佳聚类数 k。文章中提供了完整的 Python 代码,并逐步讲解如何观察绘制的图表,从而确定合适的 k 值。适合对聚类算法和模型评估感兴趣的读者阅读与实践。喜欢的朋友记得点赞、收藏、转发和关注哦!

2025-02-23 17:38:24 1514

原创 【机器学习】从 ID3 到 CART:一文看懂决策树核心原理,实战 Titanic 乘客生存预测

本文系统地介绍了三种常见决策树算法(ID3、C4.5、CART)的核心思想与差异,随后结合泰坦尼克号乘客生存预测的实战示例,演示了如何使用 Python(sklearn)搭建并可视化决策树模型。文章提供了详细注释的示例代码,并分析了模型评估指标与可视化结果,为读者理解决策树在分类任务中的应用提供了思路。如果你对决策树或机器学习感兴趣,欢迎点赞、收藏、转发!

2025-02-23 16:04:44 1063 1

原创 【机器学习】【深入浅出】混淆矩阵全解析:搞懂 TP、FP、TN、FN 与分类模型评估!

本文以通俗易懂、幽默风趣的方式详细解析了混淆矩阵的定义、计算方法和实际作用。从二分类的四个核心指标——真正例(TP)、假阳性(FP)、真负例(TN)、假阴性(FN)出发,本文讲解了如何利用混淆矩阵评估模型性能,并进一步衍生出准确率、精确率、召回率和 F1-score 等关键指标。文章还通过医疗诊断等案例,展示了混淆矩阵如何帮助我们区分漏诊与误诊,并给出记忆技巧,助你快速掌握 TFPN 概念。喜欢本文的朋友请点赞、收藏、转发和关注我的博客,共同探索数据科学的魅力!

2025-02-21 22:51:02 1465

原创 【机器学习】【数据狂人必看】线性回归太“直”?试试随机森林、梯度提升和XGBoost预测加州房价!

本文用幽默轻松的风格带你了解线性回归的基本原理与局限性,告诉你为何传统“直线救星”有时并不够用;随后通过加州房价数据集的实例,展示如何利用随机森林、梯度提升和XGBoost预测房价。文章中附有详细代码和逐步讲解,帮助你在实际项目中选择合适的模型。如果你觉得文章有趣、实用,请点赞、收藏、转发并关注我的博客,帮助更多人探索数据科学的魅力!

2025-02-19 22:11:25 1023

原创 【机器学习】超参数调优指南:交叉验证,网格搜索,混淆矩阵——基于鸢尾花与数字识别案例的深度解析

本篇文章从零开始讲解交叉验证与网格搜索的概念与原理,并结合两个经典案例——鸢尾花分类与手写数字识别,展示如何在真实数据上使用 scikit-learn 的 GridSearchCV 进行 KNN 超参数调优。文章包含详细代码、注释、可视化过程以及模型评估与对比,帮助你快速上手并掌握在机器学习项目中如何寻找最优模型和超参数。赶快点赞、收藏、转发和评论吧!

2025-02-18 20:40:28 847

原创 【机器学习】深入浅出KNN算法:原理解析与实践案例分享

本文深入浅出地介绍了 K-最近邻(KNN)算法的基本原理,包括如何通过计算数据点之间的距离来选择最近邻,并根据多数投票(分类)或平均值(回归)的方式进行预测。同时,文章还讨论了 KNN 的优缺点及其在手写识别、推荐系统和医学诊断等领域的应用,并通过 Python 案例展示了如何利用 scikit-learn 库实现 KNN 分类和回归,适合初学者快速入门机器学习实践。

2025-02-17 22:53:41 1887

原创 【数据分析】03- 拒绝拍脑袋!用相关分析洞悉变量秘密,一文搞定数据探索:从“皮尔逊相关系数”到“肯德尔相关系数”

相关分析用于衡量两个或多个变量的线性关联强度与方向。本文由浅入深介绍了皮尔逊、斯皮尔曼、肯德尔等常见相关系数的原理与应用场景,结合Python实例讲解如何快速识别数据间的正负关联与单调关系,并提醒读者“相关≠因果”。通过热力图与实战案例,你将学会在数据分析与特征工程中运用相关分析这把“万能小尺子”。

2025-01-17 22:27:46 2802

原创 【数据分析】02- A/B 测试:玩转假设检验、t 检验与卡方检验

“假设检验就像法庭审判,你先假定“无差异”再看数据证据是否推翻;A/B 测试更是业务场景里的快速决策法宝。本文从原假设、备择假设,到 t 检验和卡方检验,深度剖析统计思想与实践应用。”

2025-01-15 20:45:07 1278

原创 【数据分析】01-数据分析9大分布,看这篇就够了:上手公式、Python 画图、应用大揭秘!从正态,伯努利,二项,柏松,gamma,卡方分布到T,指数,F分布

(完)

2025-01-08 23:53:57 782

原创 【python环境一键搞定!】从入门到进阶,Conda 环境管理 + Pip 环境管理全攻略!

还在手动配置各种 Python 环境?还在为包冲突秃头?这篇文章将手把手教你如何使用 Conda 来管理环境、并和 Pip 并行作战,附送国内镜像源设置方法,让你轻松告别“网络延迟”与“安装失败”!

2025-01-06 18:18:32 1276 2

原创 如何3分钟彻底搞定SSH远程连接?一文解决免密登录服务器全攻略!

• mkdir -p ~/.ssh:如果 .ssh 目录已经存在则不报错,否则自动创建。• chmod 700 ~/.ssh:设置目录权限为仅自己可读写执行。1.(Windows、macOS 或 Linux 均可),执行以下命令创建一对 SSH 密钥(公钥 & 私钥):ssh-keygen• 一路按回车(一般默认存储到 ~/.ssh/id_rsa)2.,会在 ~/.ssh 目录下得到两个文件:• id_rsa:私钥文件• id_rsa.pub:公钥文件。

2025-01-04 23:43:26 478

原创 【无标题】

nvidia-smi。

2025-01-03 14:56:00 153

原创 打造RAG系统:四大向量数据库Milvus、Faiss、Elasticsearch、Chroma 全面对比与选型指南

Milvus是一个开源的云原生向量数据库,由 Zilliz 开发和维护。Milvus 专为处理超大规模向量数据而设计,提供高效的相似性搜索和非结构化数据管理功能。它支持多种索引类型,如 IVF、HNSW 等,能够在不同应用场景中实现最佳性能。Faiss(Facebook AI Similarity Search)是由 Meta(前 Facebook)开发的开源库,专注于高效的相似性搜索和密集向量聚类。Faiss 支持搜索任意大小的向量集,尤其在高维向量空间中表现出色,广泛应用于推荐系统、图像检索等领域。

2024-12-28 21:56:56 6191 4

原创 【计算机视觉CV-图像分类】06 - VGGNet的鲜花分类实现:从数据预处理到模型优化的完整实战!

VGGNet由牛津大学视觉几何组(Visual Geometry Group, VGG)和Google DeepMind的研究人员于2014年共同开发。VGGNet在2014年ImageNet大规模视觉识别挑战赛(ILSVRC2014)中表现优异,尤其在图像分类任务中取得了显著的成绩。假设我们使用的是一个包含五类鲜花的图像数据集,每类约有100张图像。数据集分为训练集和验证集,分别存放在不同的文件夹中。利用预训练模型:加速训练过程,提升初始性能。数据增强:增加数据多样性,提升模型泛化能力。学习率调度。

2024-12-21 23:59:12 1139

原创 【计算机视觉基础CV-图像分类】05 - 深入解析ResNet与GoogLeNet:从基础理论到实际应用

随着深度神经网络层数的增加,模型的表达能力显著提升。然而,网络越深,训练过程中面临的梯度消失、梯度爆炸等问题也愈加严重,导致模型性能难以进一步提升。2015年,何凯明等人提出了残差网络(ResNet),通过引入“跳跃连接”(Shortcut Connections)有效缓解了深层网络训练中的退化问题,使得训练超过百层的深度网络成为可能。ResNet在2015年的ImageNet图像识别挑战赛中取得了显著成绩,极大地影响了后续深度神经网络的设计。GoogLeNet。

2024-12-21 00:04:25 1386

原创 【计算机视觉基础CV-图像分类】04 - 手把手教你实现AlexNet:卷积神经网络的里程碑及其实现,全面掌握图像分类的深度学习经典

在计算机视觉领域,深度学习的崛起是一个划时代的事件。回顾深度学习在图像识别方面的辉煌历程,就不能不提到AlexNet这座里程碑式的模型。2012年,Alex Krizhevsky等人提出的AlexNet在ImageNet竞赛中横空出世,将图像分类的Top-5错误率从近25%一下子拉低到16%左右,远超传统手工特征与浅层模型的表现。这一突破性进展引发了后续一系列深度卷积神经网络(CNN)的繁荣发展,从而开启了计算机视觉研究的新纪元。AlexNet架构图。

2024-12-20 01:02:29 847

原创 【计算机视觉基础CV-图像分类】03-深度学习图像分类实战:鲜花数据集加载与预处理详解

在计算机视觉的深度学习实践中,数据加载和预处理是至关重要的一步。无论你是初学者,还是有一定经验的从业者,都需要深刻理解如何将原始数据转化为神经网络可接受的输入。PyTorch中的和为我们提供了极大的便利,使图像数据的加载和处理更加高效与简洁。本文将以“鲜花分类数据集”(一个包含5种不同花卉类别的图像数据集)为例,详细讲述如何使用类进行数据加载,并通过transforms对图像进行预处理和数据增强。我们还会深入讨论数据集结构、训练/验证集划分、代码注释和实践建议,并给出超过3000字的详细说明。

2024-12-19 13:02:10 1366

原创 【计算机视觉基础CV-图像分类】02-入门详解图像分类、经典数据集、比赛与冠军图像模型演进史

图像分类是计算机视觉中最基础、最常见的任务之一。给定一张输入图像,任务是从预定义的类别集合中选择与该图像最匹配的一个或多个类别标签。举例:假设类别集为,当我们给模型一张熊猫的图片,模型需要通过特征提取与分析,最终给出各类别的概率(如dog:1%,cat:4%,panda:95%),并根据最高概率选择“panda”作为标签,即完成了图像分类任务。与目标检测、图像分割等其他计算机视觉任务相比,图像分类的要求更“粗”一些,它不关心物体在图中的位置和像素级轮廓,只需判断图中出现了什么。

2024-12-19 11:17:48 1470

原创 【计算机视觉基础CV-图像分类】01- 从历史源头到深度时代:一文读懂计算机视觉的进化脉络、核心任务与产业蓝图

图像分类(Classification):单一对象类别识别,不关心位置。分类+定位(Classification+Localization):单一对象类别识别并给出位置框。目标检测(Object Detection):多个对象的分类与定位。语义分割(Semantic Segmentation):按像素级别对图中每个区域进行类别分类,不区分同类物体的实例。实例分割(Instance Segmentation):像语义分割一样按像素分割,但进一步区分相同类别物体的不同实例。

2024-12-19 10:25:16 3029

原创 Prompt-Tuning(提示词微调)深度解析:带你看懂从离散到连续提示的技术演进

Prompt-Tuning 是近年来自然语言处理(NLP)领域的一项核心技术,其通过精心设计的提示(Prompt),让预训练模型更高效地适配下游任务,逐渐替代传统的 Fine-Tuning 方法,成为模型微调的高效解决方案。• 模板:“任务:[描述任务目标] 输入:[任务输入] 输出:[任务输出]”:用可训练的向量表示任务提示(Prompt),优化这些向量以适配任务。• 输入:“任务:判断评论的情感 输入:我喜欢这部电影。:将分类任务建模为完形填空任务,通过离散 Prompt 优化输出。

2024-11-28 23:57:49 4622

原创 NLP任务四大范式的进阶历程:从传统TF-IDF到Prompt-Tuning(提示词微调)

•。

2024-11-28 10:40:39 1613 1

原创 【大模型】从零样本到少样本学习:一文读懂 Zero-shot、One-shot 和 Few-shot 的核心原理与应用!

Zero-shot 学习指模型仅通过任务描述(Task Description)理解任务,并在没有任何示例的情况下预测输出结果。它完全依赖于预训练阶段中学习到的通用知识,不需要针对具体任务的额外数据。

2024-11-27 23:59:30 3823 2

原创 【大模型】深度解析 NLP 模型5大评估指标及 应用案例:从 BLEU、ROUGE、PPL 到METEOR、BERTScore

• 参考文本的 3-grams 为:{today is a, is a nice, a nice day}• 参考文本的 2-grams 为:{today is, is a, a nice, nice day}• 候选文本的 3-grams 为:{it is a, is a nice, a nice day}• 候选文本的 2-grams 为:{it is, is a, a nice, nice day}• 参考文本的 1-grams 为:{today, is, a, nice, day}

2024-11-27 22:42:00 3267

原创 BERT分词器全面解析:从Tokenizer到模型推理的完整实践指南!

而BERT的核心输入预处理工具之一——分词器(Tokenizer),在模型的成功应用中扮演了至关重要的角色。BERT分词器是预训练模型中不可或缺的一环,其主要作用是将自然语言文本转化为模型可处理的输入格式。在实际应用中,合理配置分词器的参数,并结合模型的需求进行预处理,能够显著提升模型的推理效率与性能。通过理解 outputs 的内容和结构,可以根据任务需求灵活提取需要的特征,应用于各种自然语言处理任务。在BERT模型中,分词器的作用是将自然语言文本转换为模型可以理解的输入格式。

2024-11-21 12:11:54 2366

原创 PyTorch 深度揭秘:为什么推理阶段必须加 model.eval() 和 torch.no_grad()?不加会翻车吗?

• model.eval():用于切换到评估模式,确保 Dropout 和 BatchNorm 等层的行为正确。• torch.no_grad():禁用梯度计算,节省内存并加速推理。•。

2024-11-21 10:26:53 1018

原创 交叉熵损失 在PyTorch 中的计算过程

其实就是根据 真实值的结果,当成索引去取的值。

2024-10-11 15:31:22 383

原创 【NLP自然语言处理】03 - 使用Anaconda创建新的环境/pycharm切换环境

前提:先下载安装 Anaconda 第一步:查看有多少个虚拟环境 第二步:创建一个虚拟环境,名字nlpbase, python=3.10 第三步:激活新环境:nlpbase第四步: 下载结巴分词: jieba第五步:查看是否成功安装结巴第六步:pycharm 使用心得anaconda 虚拟环境: nlpbase

2024-10-07 11:01:42 680

【深度学习CV】图像分类如何训练一个高效的 图像分类模型:手工设计CNN、开源模型resnet到GPU优化

【深度学习CV】【图像分类】如何训练一个高效的 图像分类模型:手工设计CNN、开源模型resnet到GPU优化 包含代码完整的代码,和优化过程~

2025-03-06

深度学习循环神经网络案例讲解-基于 PyTorch 的中文歌词生成-RNN,LSTM,GRU 从数据预处理到预测全流程详解

循环神经网络 RNN,LSTM, GRU 歌词预测代码与数据

2025-02-28

深度学习多分类任务的一站式解决方案!从数据预处理到混淆矩阵,手把手教你做手机价格预测

包含数据和完整的代码以及结果和可视化过程

2025-02-26

机器学习【KMeans聚类分析实战】用户分群聚类详解-SSE、CH 指数、SC全解析,实战电信客户分群案例

包含输入输出,可视化案例。聚类算法

2025-02-23

从 ID3 到 CART:一文看懂决策树核心原理,实战 Titanic 乘客生存预测

cart,cd3, c4.5 决策树代码和可视化,数据,完整资源

2025-02-23

【计算机视觉基础CV】03-深度学习图像分类实战:鲜花数据集加载与预处理详解

训练和验证集数据

2024-12-19

深度学习03-神经网络 5 (完结篇) - pytroch手机价格分类案例讲解

神经网络手机价格预测数据集

2024-09-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除