Python实现利用MMR提取自动摘要

本文介绍了MMR(最大边际相关法)算法用于自动摘要的原理和实践。MMR通过平衡句子的重要性和与已有摘要句子的差异来选择摘要句子。在实践中,通过计算句子的tf-idf值和余弦相似度来实现。并提供了一个Python demo来展示这一过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

算法原理

MMR的全称是Maximal Marginal Relevance ,最大边界相关法或者最大边缘相关。公式如下:

M M R : = arg ⁡ max ⁡ D i [ λ × s c o r e ( D i ) − ( 1 − λ ) × max ⁡ [ S i m ( D i , D j ) ] ] D i , D j : 第 i , j 号 句 子 , λ : 权 衡 句 子 重 要 性 系 数 , S i m : 相 似 度 计 算 函 数 , S c o r e : 句 子 重 要 性 计 算 函 数 。 MMR:=\mathop{\arg\max}_{D_i} [\lambda\times score(D_i)-(1-\lambda)\times\max[Sim(D_i,D_j)]] \\D_i,D_j:第i,j号句子, \\\lambda:权衡句子重要性系数, \\Sim:相似度计算函数, \\Score:句子重要性计算函数。 MMR:=argmaxDi[λ×score(Di)(1λ)×max[Sim(Di,Dj)]]DiDj:

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值