
笔记整理
文章平均质量分 84
SuasyYi
计算机程序猿
展开
-
【Python】`set` 用法详解
set(集合)是 Python 内置的数据结构,特点是 元素无序、唯一,适用于 去重、集合运算 等场景,本文详解了一些常见用法原创 2025-03-07 12:23:27 · 508 阅读 · 0 评论 -
【深度学习】Transformer 的常见的位置编码有哪些
Transformer 位置编码常见的方案有以下几种:三角函数位置编码(Sinusoidal PE),相对位置偏置(Relative PE),可学习位置编码(Learnable PE),RoPE(旋转位置编码),ALiBi(Attention Linear Bias)。现代 Transformer 模型更偏向于 RoPE 和 ALiBi,因为它们能适应更长的文本,并且提高了训练稳定性和泛化能力!原创 2025-02-23 18:26:26 · 1092 阅读 · 0 评论 -
【深度学习】Adam和AdamW优化器有什么区别,以及为什么Adam会被自适应学习率影响
Adam 的 L2 正则化 会影响梯度估计值,导致优化器在 自适应学习率的调节 过程中对权重衰减的影响不稳定。AdamW 的独立权重衰减 让权重衰减成为一个真正的正则化项,而不会干扰梯度估计,使得模型的 泛化能力更强。原创 2025-02-23 18:13:53 · 2905 阅读 · 0 评论 -
【深度学习】PyTorch 的发展历程 截止 2.1.0
PyTorch 作为一个深度学习框架,经历了多个版本的迭代,带来了许多新特性、改进和优化。以下是 PyTorch 主要版本的发布历程以及关键更新。原创 2024-09-13 10:47:26 · 2074 阅读 · 0 评论 -
【深度学习】Position Wise 到底是什么,有什么用
关于 Position Wise 的一些分享原创 2024-06-20 11:39:07 · 1290 阅读 · 0 评论 -
【深度学习】快速上手!关于 PyTorch 库的使用和基础方法整理
快速上手一个搭建一个简单的 pytorch 深度学习网络原创 2023-12-31 18:32:07 · 2384 阅读 · 0 评论 -
【机器学习】快速入门!关于 Pandas 库的简介和常用方法整理
快速入门使用 Pandas 库进行数据读取和处理原创 2023-12-31 18:00:47 · 1902 阅读 · 2 评论