自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 【万字】机器翻译MT全解析-文本预处理详解(Tokenization、BPE)--完整训练流程--损失函数、优化器、训练循环-评估指标详解(BLEU、ROUGE等)-解码策略 & 后处理详解

机器翻译的任务流程可以分为 **数据处理 → 模型训练 → 评估 → 预测 & 推理** 四个阶段

2025-03-09 23:29:11 1123

原创 (学习记录)BERT每一层详解、公式、从零开始代码示例、文本分类任务、 Transformer 编码器

层次作用关键公式输入层将文本转换为词向量,添加位置信息和句子信息XX多头自注意力机制计算序列中每个词语对其他词语的关注度,捕捉全局依赖关系AttentionQKVsoftmaxQKTdkVAttentionQKVsoftmaxdk​​QKT​V前馈神经网络通过非线性变换提高表达能力FFNxmax⁡0xW1b1W2b2FFNxmax0xW1​b1​W2​b2​残差连接 & 层归一化。

2025-02-23 15:55:34 1333

原创 (学习记录)生成式自编码器(Variational Autoencoder, VAE)详解

VAE 既能进行数据降维,又能用来生成新数据,比如图片、文本等。让生成的 ( x’ ) 尽可能接近原始数据 ( x )(通常使用均方误差 MSE 或 交叉熵)。普通自编码器的问题是,它只学习到了固定的编码 ( z ),无法生成新数据。,它不仅能进行数据压缩,还能生成新数据。其中 ( \beta ) 是一个超参数,控制 KL 散度的权重。不再输出一个固定的 ( z ),而是输出。让模型学习到合理的 ( p(z) )。

2025-02-22 20:13:18 615

原创 (学习记录)无监督学习、自监督学习超详细自我解读——附代码示例

这种方法结合了 无监督学习 的优势,但它更像是在没有标签数据的情况下,通过给模型设计一种 代理任务(pretext task),让模型 自己创造标签,并通过这个任务来学习数据的特征。举个例子,如果你给我一个图片,并要求我去预测图像的一部分(比如遮住一个区域,要求我预测被遮挡的部分),我就可以通过这样的任务来学习图像的结构和特征。比如,假设我有两张图片,分别是“猫”和“狗”,通过对比学习,模型可以学习到“猫”和“狗”是不同的,而相同物体的不同图像应该有相似的特征。没有明确的答案指引,只能依靠数据本身的特点。

2025-02-22 15:24:16 965

原创 ResNet-18分类 11 类食物图片——数据加载、模型初始化、超参数设置和训练,支持 半监督学习

来分类 11 类食物图片,包含。:轻量级 CNN 适用于分类任务。:改进的 Adam,适合微调任务。,使用无标签数据提升模型性能。:准确率超过 50% 时保存。:利用无标签数据提升性能。

2025-02-22 02:29:24 493

原创 超详细图解-手写 VGG-13:代码解析与对比

手写 VGG-13:代码解析与对比

2025-02-21 23:28:57 620

原创 手写 ResNet-18,残差块理解,对比官方的 torchvision 版本

我们将逐行解析,深入理解 ResNet-18 及其核心组件。

2025-02-21 17:43:58 948

原创 PyTorch 实现 AlexNet和自定义AlexNet 变体详解

PyTorch 实现 AlexNet

2025-02-21 17:01:13 954

原创 超详细PyTorch实现房价预测:数据处理 + 训练验证全解析

本项目基于 PyTorch 实现了一个用于房价预测的神经网络模型,完整流程涵盖了 数据预处理、模型构建、训练与验证、模型保存 等核心步骤。

2025-02-21 13:41:46 701

原创 基于 PyTorch 的线性回归 COVID-19 检测预测模型

本文详细解析了一个基于 PyTorch 的机器学习项目,包括数据预处理、特征选择、模型构建、训练与验证、损失函数优化以及最终模型评估。通过代码示例,我们深入理解各个步骤的实现原理,帮助读者更好地掌握 PyTorch 在实际应用中的使用技巧。

2025-02-20 23:32:17 304

原创 多层神经网络-使用 PyTorch 训练简单神经网络拟合三次多项式数据

【代码】多层神经网络-使用 PyTorch 训练简单神经网络拟合三次多项式数据。

2025-02-20 22:10:08 370

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除