目录
算法原理
MMR的全称是Maximal Marginal Relevance ,最大边界相关法或者最大边缘相关。公式如下:
M M R : = arg max D i [ λ × s c o r e ( D i ) − ( 1 − λ ) × max [ S i m ( D i , D j ) ] ] D i , D j : 第 i , j 号 句 子 , λ : 权 衡 句 子 重 要 性 系 数 , S i m : 相 似 度 计 算 函 数 , S c o r e : 句 子 重 要 性 计 算 函 数 。 MMR:=\mathop{\arg\max}_{D_i} [\lambda\times score(D_i)-(1-\lambda)\times\max[Sim(D_i,D_j)]] \\D_i,D_j:第i,j号句子, \\\lambda:权衡句子重要性系数, \\Sim:相似度计算函数, \\Score:句子重要性计算函数。 MMR:=argmaxDi[λ×score(Di)−(1−λ)×max[Sim(Di,Dj)]]Di,Dj:

本文介绍了MMR(最大边际相关法)算法用于自动摘要的原理和实践。MMR通过平衡句子的重要性和与已有摘要句子的差异来选择摘要句子。在实践中,通过计算句子的tf-idf值和余弦相似度来实现。并提供了一个Python demo来展示这一过程。
最低0.47元/天 解锁文章
1万+





