HYERI_-优快云博客

原创【谈谈AI基本功】极大似然法

在深度学习中，我们经常有一堆训练数据（比如图片和标签），并假设这些数据是由某个带参数的模型（比如神经网络）生成的。但你不知道这两种口味的比例是多少——可能是90%草莓+10%柠檬，也可能是50%-50%，或者其他比例。通过计算（或直觉），你会发现：当 p=0.8 时，出现“4 草莓 1 柠檬”的可能性最大。MLE 的目标就是：调整这些参数，使得模型认为“我们看到的训练数据”是最可能出现的。在所有可能的参数值中，找出那个“最有可能”产生我们实际观察到的数据的那个参数。这个 0.8 就是“极大似然估计值”。

2026-01-09 16:08:52 64

原创【谈谈AI基本功】带参数的注意力汇聚与不带参数的注意力汇聚

一句话核心区别。

2026-01-09 10:07:03 181

原创【谈谈AI基本功】backbone、neck、head

视觉模型的核心架构可统一为 Backbone-Neck-Head三段式结构，各部分分工明确且紧密协作：

2026-01-01 17:28:04 144

原创【谈谈AI基本功】Checkpoint

Checkpoint 是模型的“快照”，加载别人的 checkpoint = 站在巨人肩膀上快速成功。

2025-12-29 11:08:07 192

原创【谈谈AI基本功】机器学习四大学习范式：监督学习、非监督学习、半监督学习、强化学习

2025-12-23 11:27:11 94

原创【谈谈AI基本功】全连接层、隐藏层、输出层、激活函数、损失函数、反向传播

没有激活函数 → 多层网络退化为单层线性模型。更新参数，使模型越来越准。

2025-12-22 15:23:27 213

原创【谈谈AI基本功】交叉熵损失函数和均方误差损失函数

MSE交叉熵任务类型回归分类输出要求实数值概率（0~1，和为1）对错误的敏感度平滑，对大误差惩罚更强对低置信度错误惩罚更强回归用 MSE，分类用交叉熵。

2025-12-22 11:52:18 238

原创【AI项目急救手册】with read_base()继承基础配置用法

这段代码中的 with read_base: 并非标准 Python 用法，而是 OpenMMLab 配置系统（如 MMEngine）特有的 DSL 语法。其核心作用是：告知配置加载器，块内的 import 用于继承基础配置，而非定义当前作用域的变量。🧠 为什么需要这个？

2025-12-11 14:17:44 114

原创【AI项目急救手册】装饰器：@MODELS.register_module()

开发者定义各种模块（如 Backbone、Neck、Head 等）。这些模块通过装饰器注册到一个全局的注册表中。训练/推理时，系统根据配置文件中的字符串名称（如 ‘ResNet’）自动查找并实例化对应的类。

2025-12-11 11:57:41 249

原创【谈谈AI基本功】前向传播 vs 后向传播：神经网络的“做题”与“改错”

前向传播”和“后向传播”其实就像人脑的做题和改错过程。

2025-12-10 11:49:46 150

原创【谈谈AI基本功】量化——深度学习模型瘦身术

后量化是快餐，前量化是私房菜根据你的需求、时间和资源，选择合适的“瘦身”方案。

2025-12-10 10:57:23 206

原创【谈谈AI基本功】自注意力计算

用 3×3 灰度图像的例子来演示图像中的自注意力计算，使用具体数值。3×3 图像自注意力数值示例原始图像[10 20 3040 50 6070 80 90 ]我们将每个像素视为一个“词”，需要添加位置信息。这里我们使用简单的行、列位置编码：位置编码维度 = 2（x坐标和y坐标）像素值归一化到 [0,1] 以便计算第一步：创建特征向量每个像素的特征向量 = [像素值, x坐标, y坐标]设坐标原点在左上角：像素 (0,0): [10, 0, 0]

2025-12-09 10:16:57 710

原创【谈谈AI基本功】Softmax

它通常用在多分类神经网络的最后一层，把模型输出的分数变成每个类别的概率，从而选出最可能的一个。例如，在图像分类中，输入一张猫的图片，模型输出可能是 [猫：5.0，狗：1.2，鸟：-1.0]，经过 Softmax 后变成类似 [0.96, 0.04, 0.00] 的概率，我们就知道模型有 96% 的把握认为这是猫。一句话总结：Softmax 是一个“多选一”的概率转换器，它将任意一组数字变成总和为1的概率，用于确定最可能的类别。放大：让大的数字相对更大，小的更小（突出差距）。压缩：把所有数字都变成正数。

2025-12-08 20:44:36 317

原创【谈谈AI基本功】多头注意力

一句话总结：多头注意力让 AI 学会了“眼观六路、耳听八方”，一次性从多个维度理解信息。多头注意力 = 让 AI 同时用多个“专业视角”分析同一段信息，然后合并所有视角的结果。更聪明：不同头会自发学习不同的关注模式（比如有的关注语法，有的关注语义）壁画非常复杂，但你只有一支小手电筒（传统的注意力机制）。要看懂整幅画，你得慢慢移动手电筒，看完这里再看那里。每支手电筒都从自己专业的角度同时观察整幅画。想象你在一个黑暗的房间里看一幅巨大的壁画。以上内容维deepseek生成修改。他们在做什么（绿色手电的信息）

2025-12-08 15:47:22 178

weixin_43791941的博客

原创【谈谈AI基本功】极大似然法

原创【谈谈AI基本功】带参数的注意力汇聚与不带参数的注意力汇聚

原创【谈谈AI基本功】backbone、neck、head

原创【谈谈AI基本功】Checkpoint

原创【谈谈AI基本功】机器学习四大学习范式：监督学习、非监督学习、半监督学习、强化学习

原创【谈谈AI基本功】全连接层、隐藏层、输出层、激活函数、损失函数、反向传播

原创【谈谈AI基本功】交叉熵损失函数和均方误差损失函数

原创【AI项目急救手册】with read_base()继承基础配置用法

原创【AI项目急救手册】装饰器：@MODELS.register_module()

原创【谈谈AI基本功】前向传播 vs 后向传播：神经网络的“做题”与“改错”

原创【谈谈AI基本功】量化——深度学习模型瘦身术

原创【谈谈AI基本功】自注意力计算

原创【谈谈AI基本功】Softmax

原创【谈谈AI基本功】多头注意力

原创【AI项目急救手册】Python语法速效丸

原创【谈谈AI基本功】模型超参数与参数

原创【Pytorch修行笔记】Torchrun让PyTorch分布式训练变得像单卡一样简单

原创【谈谈AI基本功】注意力机制

原创【谈谈AI基本功】One-Stage（单阶段）和 Two-Stage（两阶段）目标检测方法

原创 OpenCV+VS 环境配置（以OpenCV4.7.0+VS2022环境配置为例）

原创 5.14.2 Qt+VS 2017 环境配置

原创 3D-DIC开源代码整理

原创用递归函数或使用堆栈生成排列组合数

空空如也

空空如也