深度学习之自然语言处理（word2vec的高速化）

无骨鱼学代码

已于 2024-05-06 17:17:38 修改

阅读量1.6k

点赞数 26

文章标签：自然语言处理深度学习 word2vec

于 2024-05-06 12:04:03 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_55922470/article/details/138484291

版权

word2vec中最大的问题是，随着语料库中处理的词汇量的增加，计算量也随之增加。

对上一章中简单的 word2vec 进行两点改进：引入名为Embedding 层的新层，以及引入名为 Negative Sampling 的新损失函数。

1 word2vec的改进①

假设词汇量有 100 万个，CBOW 模型的中间层神经元有 100 个

存在问题：

1.1 Embedding层

在上一章的 word2vec 实现中，我们将单词转化为了 one-hot 表示，并将其输入了 MatMul 层，在 MatMul 层中计算了该 one-hot 表示和权重矩阵的乘积。

图 4 - 3 中所做的无非是将矩阵的某个特定的行取出来。

现在，我们创建一个从权重参数中抽取“单词 ID 对应行（向量）”的层，这里我们称之为Embedding 层。

1.2 Embedding层的实现

从矩阵中取出某一行的处理是很容易实现的。

例子：

多行里的实现假定用于mini-batch 处理。

Embedding 层的正向传播只是从权重矩阵 W 中提取特定的行，并将该特定行的神经元原样传给下一层。因此，在反向传播时，从上一层（输出侧的层）传过来的梯度将原样传给下一层（输入侧的层）。不过，从上一层传来的梯度会被应用到权重梯度 dW 的特定行（ idx ）

这样处理存在一个问题，这一问题发生在 idx 的元素出现重复时。

最低0.47元/天解锁文章

无骨鱼学代码

博客等级

码龄4年

18
原创

134
点赞

133
收藏

116
粉丝

关注

私信

热门文章

最新评论

深度学习之自然语言处理（Attention）
优快云-Ada助手: 恭喜您撰写了这篇关于深度学习和自然语言处理的博客，特别是探讨了Attention机制。这是一个非常有趣和前沿的话题，您的文章内容详实、逻辑清晰，让读者受益匪浅。希望您能继续坚持创作，探索更多深度学习领域的知识，或许可以考虑加入一些实际案例或应用场景的讨论，以便更好地帮助读者理解和应用所学知识。期待您未来更多优质的分享，加油！
深度学习之神经网络
优快云-Ada助手: 恭喜作者发布了关于“深度学习之神经网络”的第四篇博客！持续创作并分享知识是很有价值的事情，希望作者能够继续保持这种热情和努力。下一步，建议作者可以尝试深入探讨神经网络在不同领域的应用，或者结合实际案例进行分析，这样可以让读者更加深入地了解神经网络的强大之处。期待作者更多精彩的作品！继续加油！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.youkuaiyun.com/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

大家在看

两段锁协议与触发器详解及代码案例

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。