Xiaok1018-优快云博客

原创 PyTorch嵌入层(nn.Embedding)

这个核心属性外，还有其他属性和方法。掌握这些属性和方法后，你可以更灵活地操作嵌入层！在 PyTorch 中，

2025-04-03 18:30:16 632

原创 PyTorch数据加载流程解析

这就是PyTorch数据加载的核心机制！其他复杂功能都是基于这个简单流程的扩展。

2025-04-03 15:37:57 161

原创 Adam vs SGD vs RMSProp：PyTorch优化器选择

模块提供了多种优化算法，适用于不同的深度学习任务。

2025-04-03 14:13:05 459

原创 L2范数（L2 Norm）

通过这个类，你可以灵活地控制嵌入向量的规模，从而提升模型的泛化能力！对于一个向量 x = [x₁, x₂, ..., xn]（或L2范数的平方和），作为正则化损失。“嵌入向量不要太大，否则我会惩罚你！想象你有一个向量（比如嵌入向量。），L2范数就是计算这个向量的。这个类计算所有输入嵌入矩阵的。就像在三维空间中，计算点。

2025-04-02 17:00:29 754

原创解决 Hugging Face SentenceTransformer 下载失败的完整指南：ProxyError、SSLError与手动下载方案

MaxRetryError: HTTPSConnectionPool(host='huggingface.co', port=443): Max retries exceeded with url: /api/models/sentence-transformers/all-MiniLM-L6-v2 (Caused by ProxyError('Unable to connect to proxy', SSLError(SSLError(1, '[SSL: KRB5_S_TKT_NYV] unexpecte

2025-04-01 18:30:12 825

原创神经网络权重初始化：正态分布 vs. Xavier初始化

Xavier 初始化是一种专门针对。是标准差（可以调整，例如。的神经网络的初始化方法。，避免梯度消失或爆炸。是上一层的神经元数量。是下一层的神经元数量。

2025-03-30 20:24:35 917

原创解决 Python 模块导入失败：PyCharm 项目结构与路径管理解析

✅ 将目录标记为“源根目录” = 将目录动态地加入。

2025-03-28 18:01:39 142

原创复现论文步骤

在复现前，先梳理论文和代码的对应关系，确保理解整体结构。

2025-03-28 17:37:03 929

原创梯度归一化（Gradient Normalization）

梯度归一化的核心思想是通过调整每个任务的权重，使得它们的梯度大小相对均衡。

2025-03-16 16:20:20 785

原创反向传播中 batch 内梯度更新的具体流程

ypredσWxbypredσWxbx是输入样本x 是输入样本x是输入样本W是2维权重矩阵W 是 2 维权重矩阵W是2维权重矩阵b是偏置b 是偏置b是偏置σz11e−z是Sigmoid激活\sigma(z) = \frac{1}{1 + e^{-z}} 是 Sigmoid 激活σz1e−z1是Sigmoid激活每个样本单独通过网络，生成预测值。计算损失。对每个样本独立计算梯度。

2025-03-08 14:30:50 868

原创 epoch 和 batch size

和是机器学习和深度学习中两个非常重要的概念，尤其是在训练模型时，理解它们有助于你更好地调整训练过程。好的，和是机器学习和深度学习中两个非常重要的概念，尤其是在训练模型时，理解它们有助于你更好地调整训练过程。我们逐一详细讲解。

2025-02-22 15:11:58 567

原创在Jupyter Notebook中添加conda虚拟环境

以下都将 your_environment_name 替换为自己的虚拟环境名称。安装IPython内核以便在Jupyter Notebook中运行代码。此命令将安装一个与当前虚拟环境相关联的内核。

2025-02-03 23:57:50 239

原创成功解决TypeError: MessageToJson() got an unexpected keyword argument ‘including_default_value_fields‘

但是用我的镜像源（

2024-12-05 22:44:34 862

原创《前沿技术讲座》考察报告

针对深度自然语言处理模型的鲁棒性问题，本文从有监督自然语言处理任务的典型范式出发，从数据构建简要介绍了相关研究进展。通过上述研究结果可以看到，目前绝大多数的深度自然语言处理模型缺乏在鲁棒性问题上的关注，因此在面临实际应用环境时，大多数模型很难达到在标准测试集合上的效果。这在一定程度上成为了制约其更广泛应用的一个重要因素。目前的深度自然语言处理模型依然倾向于拟合伪相关性，因此如何合理地构建训练数据集，从而让模型真正从数据里面学到知识并根据知识进行推理，依然是一个难题。

2024-07-03 12:10:18 1356

原创 cmd窗口使用‘java‘命令时报错“could not open `D:\install enviorenment\lib\amd64\”但是javac命令正常

删除C:\Windows\System32目录下的java.exe 、javaw.exe、javaws.exe。

2024-05-23 19:25:36 287 1

原创 HNUST 数据挖掘课设《实验五 KNN算法设计与应用》

KNN算法实现

2024-04-15 14:55:32 692 1

原创 HNUST 数据挖掘课设《实验二 Close 算法设计与应用》

一个频繁闭合项目集的所有闭合子集一定是频繁的；一个非频繁闭合项目集的所有闭合超集一定是非频繁的。因此可以在闭合项目集格空间上讨论项目集的频繁问题。实验证明，它对特殊数据是可以减少数据库扫描次数的。Close算法是一种用于频繁项集挖掘的算法，其主要目的是发现数据集中的闭合频繁项集,通过发现闭合频繁项集，能够避免生成大量不必要的候选项集，减少后续关联规则挖掘的计算复杂度，节省计算资源和时间，从而提高挖掘效率。

2024-04-14 12:02:52 1729 1

原创 HNUST 数据挖掘课设《实验一 Apriori算法设计与应用》

数据挖掘 Apriori算法设计与应用

2024-04-14 10:41:39 1676 3

《前沿技术讲座》考察报告

2024-07-05

《前沿技术讲座》考察报告

湖南科技大学计算机学院，《前沿技术讲座考察报告》，可供参考，4部分内容

2024-07-03

网络技术挑战赛–选拔赛，分组抽签是进行到哪个阶段了呀，有哪个参加过的朋友知道的不

2024-06-27

TA创建的收藏夹 TA关注的收藏夹

TA关注的人