自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 PyTorch嵌入层(nn.Embedding)

这个核心属性外,还有其他属性和方法。掌握这些属性和方法后,你可以更灵活地操作嵌入层!在 PyTorch 中,

2025-04-03 18:30:16 632

原创 PyTorch数据加载流程解析

这就是PyTorch数据加载的核心机制!其他复杂功能都是基于这个简单流程的扩展。

2025-04-03 15:37:57 161

原创 Adam vs SGD vs RMSProp:PyTorch优化器选择

模块提供了多种优化算法,适用于不同的深度学习任务。

2025-04-03 14:13:05 459

原创 L2范数(L2 Norm)

通过这个类,你可以灵活地控制嵌入向量的规模,从而提升模型的泛化能力!对于一个向量 x = [x₁, x₂, ..., xn](或L2范数的平方和),作为正则化损失。“嵌入向量不要太大,否则我会惩罚你!想象你有一个向量(比如嵌入向量。),L2范数就是计算这个向量的。这个类计算所有输入嵌入矩阵的。就像在三维空间中,计算点。

2025-04-02 17:00:29 754

原创 解决 Hugging Face SentenceTransformer 下载失败的完整指南:ProxyError、SSLError与手动下载方案

MaxRetryError: HTTPSConnectionPool(host='huggingface.co', port=443): Max retries exceeded with url: /api/models/sentence-transformers/all-MiniLM-L6-v2 (Caused by ProxyError('Unable to connect to proxy', SSLError(SSLError(1, '[SSL: KRB5_S_TKT_NYV] unexpecte

2025-04-01 18:30:12 825

原创 神经网络权重初始化:正态分布 vs. Xavier初始化

Xavier 初始化是一种专门针对。是标准差(可以调整,例如。的神经网络的初始化方法。,避免梯度消失或爆炸。是上一层的神经元数量。是下一层的神经元数量。

2025-03-30 20:24:35 917

原创 解决 Python 模块导入失败:PyCharm 项目结构与路径管理解析

✅ 将目录标记为“源根目录” = 将目录动态地加入。

2025-03-28 18:01:39 142

原创 复现论文步骤

在复现前,先梳理论文和代码的对应关系,确保理解整体结构。

2025-03-28 17:37:03 929

原创 梯度归一化(Gradient Normalization)

梯度归一化的核心思想是通过调整每个任务的权重,使得它们的梯度大小相对均衡。

2025-03-16 16:20:20 785

原创 反向传播中 batch 内梯度更新的具体流程

ypredσWxbypred​σWxbx是输入样本x 是输入样本x是输入样本W是2维权重矩阵W 是 2 维权重矩阵W是2维权重矩阵b是偏置b 是偏置b是偏置σz11e−z是Sigmoid激活\sigma(z) = \frac{1}{1 + e^{-z}} 是 Sigmoid 激活σz1e−z1​是Sigmoid激活每个样本单独通过网络,生成预测值。计算损失。对每个样本独立计算梯度。

2025-03-08 14:30:50 868

原创 epoch 和 batch size

和是机器学习和深度学习中两个非常重要的概念,尤其是在训练模型时,理解它们有助于你更好地调整训练过程。好的,和是机器学习和深度学习中两个非常重要的概念,尤其是在训练模型时,理解它们有助于你更好地调整训练过程。我们逐一详细讲解。

2025-02-22 15:11:58 567

原创 在Jupyter Notebook中添加conda虚拟环境

以下都将 your_environment_name 替换为自己的虚拟环境名称。安装IPython内核以便在Jupyter Notebook中运行代码。此命令将安装一个与当前虚拟环境相关联的内核。

2025-02-03 23:57:50 239

原创 成功解决TypeError: MessageToJson() got an unexpected keyword argument ‘including_default_value_fields‘

但是用我的镜像源 (

2024-12-05 22:44:34 862

原创 《前沿技术讲座》考察报告

针对深度自然语言处理模型的鲁棒性问题,本文从有监督自然语言处理任务的典型范式出发,从数据构建简要介绍了相关研究进展。通过上述研究结果可以看到,目前绝大多数的深度自然语言处理模型缺乏在鲁棒性问题上的关注,因此在面临实际应用环境时,大多数模型很难达到在标准测试集合上的效果。这在一定程度上成为了制约其更广泛应用的一个重要因素。目前的深度自然语言处理模型依然倾向于拟合伪相关性,因此如何合理地构建训练数据集,从而让模型真正从数据里面学到知识并根据知识进行推理,依然是一个难题。

2024-07-03 12:10:18 1356

原创 cmd窗口使用‘java‘命令时报错“could not open `D:\install enviorenment\lib\amd64\”但是javac命令正常

删除C:\Windows\System32目录下的java.exe 、javaw.exe、javaws.exe。

2024-05-23 19:25:36 287 1

原创 HNUST 数据挖掘课设 《实验五 KNN算法设计与应用》

KNN算法实现

2024-04-15 14:55:32 692 1

原创 HNUST 数据挖掘课设 《实验二 Close 算法设计与应用》

一个频繁闭合项目集的所有闭合子集一定是频繁的;一个非频繁闭合项目集的所有闭合超集一定是非频繁的。因此可以在闭合项目集格空间上讨论项目集的频繁问题。实验证明,它对特殊数据是可以减少数据库扫描次数的。Close算法是一种用于频繁项集挖掘的算法,其主要目的是发现数据集中的闭合频繁项集,通过发现闭合频繁项集,能够避免生成大量不必要的候选项集,减少后续关联规则挖掘的计算复杂度,节省计算资源和时间,从而提高挖掘效率。

2024-04-14 12:02:52 1729 1

原创 HNUST 数据挖掘课设 《实验一 Apriori算法设计与应用》

数据挖掘 Apriori算法设计与应用

2024-04-14 10:41:39 1676 3

《前沿技术讲座》考察报告

《前沿技术讲座》考察报告

2024-07-05

《前沿技术讲座》考察报告

湖南科技大学计算机学院,《前沿技术讲座考察报告》,可供参考,4部分内容

2024-07-03

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除