34、自然语言处理中的模型与方法

落叶知秋263

于 2025-08-31 09:57:38 发布

阅读量28

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习视角下的NLP 文章标签：自然语言处理对抗共享-私有网络语言模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/ansible6ops/article/details/151094828

机器学习视角下的NLP 专栏收录该内容

36 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

自然语言处理中的模型与方法

1. 对抗共享 - 私有网络与训练技巧

在训练模型时，若从一开始就优化总损失 $L$，可能无法实现快速收敛或提升性能。一个实用的技巧是，先在最初的几次训练迭代中最大化某个量，之后再按照 $L$ 的要求进行最小化操作。这是因为在训练初始阶段，随机初始化的模型无法进行可靠的任务分类，此时“混淆”任务分类器对模型并无帮助，因为根本不存在有效的任务分类器。通过多次迭代最大化该量，能最大化任务分类的对数似然，从而得到一个合理的任务分类器模型，特别是对输出参数 $p$ 进行训练。训练好的任务分类器输出层为我们提供了一个通道，可通过“混淆”任务分类器从共享参数中去除特定任务信息。

2. 所学模型与方法总结

语言模型 ：包括神经 $n$ - 元语言模型和循环神经语言模型。
估计方法 ：噪声对比估计。
词表示 ：词嵌入作为分布式词表示，以及上下文词嵌入。
学习策略 ：预训练和迁移学习。

3. 模型发展历程

词嵌入相关 ：Bengio 等人在 2003 年提出神经 $n$ - 元语言模型。Collobert 等人在 2011 年展示了词嵌入在神经自然语言处理中表示输入的实用性。Hierarchical softmax（Morin 和 Bengio，2005）和对数双线性模型（Mnih 和 Hinton，2007）启发了 CBO

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。