- 博客(18)
- 收藏
- 关注
原创 PyTorch嵌入层(nn.Embedding)
这个核心属性外,还有其他属性和方法。掌握这些属性和方法后,你可以更灵活地操作嵌入层!在 PyTorch 中,
2025-04-03 18:30:16
632
原创 L2范数(L2 Norm)
通过这个类,你可以灵活地控制嵌入向量的规模,从而提升模型的泛化能力!对于一个向量 x = [x₁, x₂, ..., xn](或L2范数的平方和),作为正则化损失。“嵌入向量不要太大,否则我会惩罚你!想象你有一个向量(比如嵌入向量。),L2范数就是计算这个向量的。这个类计算所有输入嵌入矩阵的。就像在三维空间中,计算点。
2025-04-02 17:00:29
754
原创 解决 Hugging Face SentenceTransformer 下载失败的完整指南:ProxyError、SSLError与手动下载方案
MaxRetryError: HTTPSConnectionPool(host='huggingface.co', port=443): Max retries exceeded with url: /api/models/sentence-transformers/all-MiniLM-L6-v2 (Caused by ProxyError('Unable to connect to proxy', SSLError(SSLError(1, '[SSL: KRB5_S_TKT_NYV] unexpecte
2025-04-01 18:30:12
825
原创 神经网络权重初始化:正态分布 vs. Xavier初始化
Xavier 初始化是一种专门针对。是标准差(可以调整,例如。的神经网络的初始化方法。,避免梯度消失或爆炸。是上一层的神经元数量。是下一层的神经元数量。
2025-03-30 20:24:35
917
原创 反向传播中 batch 内梯度更新的具体流程
ypredσWxbypredσWxbx是输入样本x 是输入样本x是输入样本W是2维权重矩阵W 是 2 维权重矩阵W是2维权重矩阵b是偏置b 是偏置b是偏置σz11e−z是Sigmoid激活\sigma(z) = \frac{1}{1 + e^{-z}} 是 Sigmoid 激活σz1e−z1是Sigmoid激活每个样本单独通过网络,生成预测值。计算损失。对每个样本独立计算梯度。
2025-03-08 14:30:50
868
原创 epoch 和 batch size
和是机器学习和深度学习中两个非常重要的概念,尤其是在训练模型时,理解它们有助于你更好地调整训练过程。好的,和是机器学习和深度学习中两个非常重要的概念,尤其是在训练模型时,理解它们有助于你更好地调整训练过程。我们逐一详细讲解。
2025-02-22 15:11:58
567
原创 在Jupyter Notebook中添加conda虚拟环境
以下都将 your_environment_name 替换为自己的虚拟环境名称。安装IPython内核以便在Jupyter Notebook中运行代码。此命令将安装一个与当前虚拟环境相关联的内核。
2025-02-03 23:57:50
239
原创 成功解决TypeError: MessageToJson() got an unexpected keyword argument ‘including_default_value_fields‘
但是用我的镜像源 (
2024-12-05 22:44:34
862
原创 《前沿技术讲座》考察报告
针对深度自然语言处理模型的鲁棒性问题,本文从有监督自然语言处理任务的典型范式出发,从数据构建简要介绍了相关研究进展。通过上述研究结果可以看到,目前绝大多数的深度自然语言处理模型缺乏在鲁棒性问题上的关注,因此在面临实际应用环境时,大多数模型很难达到在标准测试集合上的效果。这在一定程度上成为了制约其更广泛应用的一个重要因素。目前的深度自然语言处理模型依然倾向于拟合伪相关性,因此如何合理地构建训练数据集,从而让模型真正从数据里面学到知识并根据知识进行推理,依然是一个难题。
2024-07-03 12:10:18
1356
原创 cmd窗口使用‘java‘命令时报错“could not open `D:\install enviorenment\lib\amd64\”但是javac命令正常
删除C:\Windows\System32目录下的java.exe 、javaw.exe、javaws.exe。
2024-05-23 19:25:36
287
1
原创 HNUST 数据挖掘课设 《实验二 Close 算法设计与应用》
一个频繁闭合项目集的所有闭合子集一定是频繁的;一个非频繁闭合项目集的所有闭合超集一定是非频繁的。因此可以在闭合项目集格空间上讨论项目集的频繁问题。实验证明,它对特殊数据是可以减少数据库扫描次数的。Close算法是一种用于频繁项集挖掘的算法,其主要目的是发现数据集中的闭合频繁项集,通过发现闭合频繁项集,能够避免生成大量不必要的候选项集,减少后续关联规则挖掘的计算复杂度,节省计算资源和时间,从而提高挖掘效率。
2024-04-14 12:02:52
1729
1
网络技术挑战赛–选拔赛,分组抽签是进行到哪个阶段了呀,有哪个参加过的朋友知道的不
2024-06-27
TA创建的收藏夹 TA关注的收藏夹
TA关注的人