集束搜索（Beam Search）详解：让AI生成更合理的序列！

原创

于 2025-07-04 18:45:00 发布 · 945 阅读

12 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #python #集束算法 #Beam Search #算法

嗨，各位技术小伙伴们！今天咱们来聊一个在自然语言处理（NLP）和序列生成任务中超重要的算法——集束搜索（Beam Search）！🎯 无论是机器翻译、文本摘要，还是对话系统，集束搜索都能让AI生成的句子更通顺、更合理。它到底是怎么工作的？和贪心搜索（Greedy Search）有什么区别？别急，咱们就通过下面文章一次性搞懂！📚

🌰 开篇小例子：翻译“Hello”到中文

假设我们训练了一个中译英的神经网络模型，输入是“我爱你”，模型会逐步生成英文词：

第一步：生成“I”、“LOVE”、“YOU”（概率分别为0.3、0.6、0.1）。
第二步：根据上一步选的词，继续生成下一个词……

如果用贪心搜索，在翻译每个字的时候，直接选择条件概率最大的候选值作为当前最优。

而集束搜索是对贪心算法的一个改进算法。相对贪心算法扩大了搜索空间🎉

🤖 什么是集束搜索？

集束搜索是一种启发式搜索算法，它在每一步生成序列时，保留概率最高的前k个候选序列（k称为“集束宽度”），然后继续扩展这些序列，直到生成完整结果。

🔄 和贪心搜索的区别

方法	每一步候选数	优点	缺点
贪心搜索	1	速度快	容易陷入局部最优（如“你你好”）
集束搜索	k（可调）	能找到全局更优的序列	计算量比贪心搜索大

💻 集束搜索的步骤（以机器翻译为例）

假设我们要将英文“I love NLP”翻译成中文，集束宽度 k

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

AI妈妈手把手

关注关注

6
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

文本生成中的自回归（集束搜索）

AI架构师小马

09-10

689

文本生成中的自回归（集束搜索）作者：禅与计算机程序设计艺术 / Zen and the Art of Computer Programming 1. 背景介绍 1.1 问题的由来文本生成是自然语言处理（NLP）领域一个经典且充满

自然语言处理之机器翻译：Sequence-to-Sequence(Seq2Seq)模型与BeamSearch算法详解

zhubeibei168的博客

04-14

762

机器翻译(Machine Translation, MT)是自然语言处理(NLP)领域的一个重要任务，其目标是将一种语言的文本自动转换为另一种语言的文本，同时保持原文的语义和语法结构。随着深度学习技术的发展，Seq2Seq模型因其在序列生成任务上的出色表现而成为机器翻译的主流方法之一。BeamSearch算法是一种在序列生成任务中用于优化搜索过程的策略，尤其在自然语言处理的机器翻译中，它被广泛采用以提高翻译质量和效率。

参与评论您还未登录，请先登录后发表或查看评论

集束搜索（Beam Search）

csdn_xmj的博客

07-28

6436

来源：Coursera吴恩达深度学习课程我们来看看集束搜索（beam search）算法，上篇文章选择最可能的句子讲了对于机器翻译来说，给定输入（法语句子），我们并不想要一个随机的英语翻译结果，而是想要一个最好的，最可能的英语翻译结果。对于语音识别也一样，给定一个输入的语音片段，我们不会想要一个随机的文本翻译结果，而是想要最接近原意的翻译结果，集束搜索就是解决这个最常用的算法。让我们用法语句子的例子来试一下集束搜索吧。 “Jane visite l'Afrique en Septembre.”（法

集束搜索

kyle1314608的博客

05-22

2126

看计算机科学中最重要的32个算法，其中有个是集束搜索（又名定向搜索，Beam Search）——最佳优先搜索算法的优化。使用启发式函数评估它检查的每个节点的能力。不过，集束搜索只能在每个深度中发现前m个最符合条件的节点，m是固定数字——集束的宽度。泛泛的介绍，不是很能理解清楚，于是有百度又google，写篇东西备忘。先贴维基百科的地址：Beam Sea...

集束搜索（Beam Search Algorithm ）

DavidChen的博客

08-06

1万+

Beam Search（集束搜索）

最新发布

weixin_39699362的博客

06-23

1295

Beam Search（集束搜索）是一种启发式图搜索算法，常用于自然语言处理、语音识别等序列生成任务。其核心思想是在每一步搜索中保留固定数量（Beam Width）的最优候选解，丢弃其他次优解，通过平衡计算复杂度和搜索质量，实现比贪心搜索更优的结果，同时避免穷举搜索的指数级复杂度。核心思想宽度控制：通过 beam sizek控制搜索宽度，避免组合爆炸。路径剪枝：每一步只保留得分最高的k个序列，其余被丢弃。序列扩展：对每个候选序列生成所有可能的后续步骤，重新评估得分。终止条件。

贪心搜索（greedy search）、集束搜索（beam search）、随机采样（random sample）

jiangchao98的博客

05-24

5801

当我们训练完成一个自然语言生成模型后，需要使用这个模型生成新的语言（句子），如何生成这些句子，使用如下的方法：贪心搜索，集束搜索，随机搜索。贪心搜索(greedy search)/采样(Sampling) 贪心搜索最为简单，直接选择每个输出的最大概率，直到出现终结符或最大句子长度。在每个阶段都选择分值最高的项。此方法经常奏效，但显然不是最优的。集束搜索(beam search) 集束搜索是一种启发式图搜索算法，在图的解空间比较大的情况下，为了减少搜索所占用的空间和时间，在每一步深度扩展

AI写作：为AI人工智能领域赋能

AI天才研究院

04-05

2198

AI写作技术作为自然语言处理(NLP)领域的重要应用方向，正在深刻改变内容创作的方式。系统介绍AI写作的技术原理分析主流AI写作模型的架构特点提供实践性的代码示例探讨实际应用中的关键问题展望未来发展趋势本文涵盖从基础理论到高级应用的完整知识体系，适用于希望深入了解AI写作技术的开发者和研究人员。背景介绍：建立基本概念框架核心概念：解析关键技术原理算法实现：通过代码演示具体实现数学原理：深入底层数学模型实践应用：展示真实场景案例资源推荐：提供学习路径和工具。

CRF解码过程可视化详解：维特比算法如何选出最佳标签序列？

在自然语言处理领域，序列标注任务如命名实体识别（NER）、词性标注和分词，一直是基础而关键的研究方向。尽管近年来深度学习模型取得了显著进展，但如何确保输出标签序列的全局一致性，仍然是一个挑战。你有没有...

浅析集束搜索(Bean Search) 算法

chenzhiwen1998的博客

04-06

4648

集束搜索(Bean Search) 背景场景一：如果说，你想实现：输入一段语音片段，经过一一列操作，实现最后输出语音的内容。再此过程中，假如你不想随机输出一些结果，而想得到最好最优的输出结果，此时，则需要本算法。场景二：实现机器翻译，输入一段法语，输出一段最有的翻译结果。方法： 1. 使用的网络： 2.词典 3.思想与贪心算法不同，集束算法含有一个变量b(bean width), 用来存放在一次搜索中，搜索多少个可能的结果。例如：第一步：在搜索第一个词时，

使用集束搜索(beam search)方法的图搜索算法

02-23

使用集束搜索(beam search)方法的图搜索算法(Java)。程序中的队列类大家可以自己实现，我是自己编写了一个，附在源码目录中。

Beam Search（集束搜索）算法

qq_36782366的博客

11-01

8956

1.概念 Beam Search（集束搜索）：是一种启发式图搜索算法，在图的解空间比较大的情况下，为了减少搜索所占用的空间和时间，在每一步深度扩展的时候，剪掉一些质量比较差的结点，保留下一些质量较高的结点。好处：减少了空间消耗，并提高了时间效率。启发式搜索是利用问题拥有的启发信息来引导搜索，达到减少搜索范围、降低问题复杂度的目的 2.过程 Beam Search（集束搜索）：使用广...

集束搜索（beam search）

qq_40722284的博客

04-23

1887

基本的集束搜索算法解决的问题寻找一个最接近原意的结果过程第一步，找到第一个输出y的概率值。其中考虑一个概念--集束宽（beam width，简称bw）,表示在每一步中有多少选择。执行过程是，将法语句子输入到编码网络，然后解码网络，softmax层会输出10,000个输出概率值，然后取bw个单词保存起来。（即保存前bw个值）。第二步，在第一步选出的单词作为第一个，然后考虑第...

集束搜索BeamSearch

Taylar_where的博客

05-23

1075

在开始写关于集束搜索的文章之前，我发现我对很多相关的算法都不是很熟悉，这严重影响到了我对集束搜索的理解，为了能让自己更好的理解集束搜索，我又回顾了一些基础。我的回顾之旅: BFS算法中，我总结了两篇二叉树的BFS搜索和无向图的BFS搜索，在理解BFS搜索算法的过程中又额外涉及到了通过树的中序和先序遍历生成二叉树和存储无向图的邻接矩阵和邻接链表这两个知识点，有兴趣的朋友可以查看我的文集“算法之...

深度学习基础—Beam search集束搜索

sniper_fandc的博客

11-15

1194

注意：观察集束搜索算法，可以发现其搜索树相当于每次生成3*10000个结果（除了第一次生成外），然后剪枝，只保留3种概率最大的结果，即节省了计算，有能保证最好的结果没有被网络丢掉（一般来说最好的结果和概率最大的结果概率相差不会很远，合理的选择集束宽B的大小可以保证找到最优的结果）B越大，算法可选择的越多，结果越好，但计算更慢；说明集束搜索算法得到的使概率最大化的句子（y^）是使概率最大化的句子，但是y*显然是更好的句子，RNN应该输出的是y*的概率更大，此时RNN网络输出更差，更值得优化RNN网络。

Beam Search（集束搜索/束搜索）

lzw17750614592的博客

04-22

1632

1.简介 Beam Search（集束搜索）是一种启发式图搜索算法，通常用在图的解空间比较大的情况下，为了减少搜索所占用的空间和时间，在每一步深度扩展的时候，剪掉一些质量比较差的结点，保留下一些质量较高的结点。这样减少了空间消耗，并提高了时间效率，但缺点就是有可能存在潜在的最佳方案被丢弃，因此Beam Search算法是不完全的，一般用于解空间较大的系统中。 2.流程 Beam Search...

深度学习：自然语言生成-集束/柱搜索beam search和随机搜索random search