推荐系统（二十四）：Embedding层的参数是如何在模型训练过程中学习的？

Jin_Kwok

已于 2025-04-23 19:58:28 修改

阅读量989

点赞数 18

CC 4.0 BY-SA版权

分类专栏：从0到1学会商品推荐系统文章标签： embedding 学习人工智能 TensorFlow 推荐算法商品推荐深度学习

于 2025-04-23 19:57:45 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Jin_Kwok/article/details/147459979

从0到1学会商品推荐系统专栏收录该内容

24 篇文章 ¥15.90 ¥99.00

订阅专栏

超级会员免费看

近来有不少读者私信我关于嵌入层（Embedding层）参数在模型训练过程中如何学习的问题。虽然之前已经在不少文章介绍过 Embedding，但是为了读者更好地理解，笔者将通过本文详细解读嵌入层（Embedding Layer）的参数如何更新的，尤其是在反向传播过程中，为什么输入层的参数会被更新，而通常反向传播更新的是神经网络的权重参数，而不是输入数据，很多读者可能会混淆输入数据和嵌入层的权重参数。

一、嵌入层参数更新的本质机制解析

嵌入层（Embedding Layer）的参数更新逻辑与传统神经网络层的参数更新有本质区别，核心在于嵌入层的权重矩阵本身就是模型参数，而非输入数据的静态特征。以下从技术原理和实现细节两个层面详细说明：

1.参数定位：权重矩阵是模型的一部分

权重矩阵的角色
嵌入层的核心是一个可学习的权重矩阵，以商品类目为例，类目对应的 embedding 矩阵形状为 (类目词汇表大小, 嵌入维度)。例如，当类目词汇表包含 1000 个类目且嵌入维度为 300 时，该矩阵为 1000×300 的可训练参数。
关键区别：输入数据是离散的索引（如类目ID=5），而嵌入层的权重矩阵是模型的一部分，与全连接层的权重性质完全相同。
查表操作的实质
前向传播时，输入索引（如[2,5]）通过查表操作（类似weight[[2,5]]）提取对应行向量。此过程看似是“输入处理”，但查表操作本身包含参数访问，因此反向传播时梯度会传递到权重矩阵。

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Jin_Kwok 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。