在今天这个被语言模型深刻影响的时代,自然语言处理(Natural Language Processing, NLP)成为了人工智能技术最为核心和活跃的研究领域之一。无论是聊天机器人、机器翻译、语音助手,还是搜索引擎、文本生成系统,背后无一不依赖NLP技术。而在整个NLP的架构中,有一个关键的概念常常被提起,却又常常被忽略:上下文。
什么是上下文?我们为何要关注它?上下文到底如何影响模型的效果?一个没有上下文意识的语言模型,究竟有多“盲”?我们又如何构建对上下文理解能力更强的模型?

1. 语言的本质离不开上下文
语言并非孤立出现的符号堆砌,而是承载人类思维的复杂系统。无论是一个词、一个句子、甚至是一段文章的含义,其正确解读几乎都依赖于上下文信息。
1.1 多义性与上下文的解歧功能
考虑下列句子:
-
他推了我一下,很“轻”。
这个“轻”可能是褒义,也可能是贬义。但我们无法凭借这句话孤立地确定其态度,必须结合上下文,例如:
-
他虽然生气了,但还是很克制,只推了我一下,很轻。
现在我们大致可以判断,这个“轻”可能是表达一种克制的行为。上下文的解歧功能(disamb
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



