- 你的Word2Vec应用中用的是Skip-gram还是CBOW?
- 请推导逻辑回归的损失函数?
- L1与L2的区别是什么?
- 什么是Negative Sampling?
[面试题]机器学习算法工程师面试题
最新推荐文章于 2025-11-10 09:58:11 发布
本文探讨了Word2Vec模型中的两种主要架构——Skip-gram与CBOW,并介绍了逻辑回归损失函数的推导过程。此外,还对比了L1与L2正则化的区别,解释了Negative Sampling在训练大规模数据集时的作用。
1101

被折叠的 条评论
为什么被折叠?



