开源项目推荐:Evaluating the Factual Consistency of Abstractive Text Summarization
1. 项目基础介绍和主要编程语言
本项目是由Salesforce团队开发的开源项目,旨在评估抽象文本摘要的事实一致性。项目的核心是提出了一种基于模型的弱监督方法,用于验证事实一致性并识别源文档与生成的摘要之间的冲突。主要编程语言为Python,占比约94.3%,其次为Shell脚本,占比约5.7%。
2. 项目的核心功能
- 数据生成:通过一系列基于规则的变换对源文档的句子进行处理,生成训练数据。
- 模型训练:模型同时训练三个任务:识别句子在变换后是否保持事实一致性、从源文档中提取支持一致性预测的跨度、如果存在不一致,则从摘要句子中提取跨度。
- 模型评估:将模型应用于几种最先进的模型生成的摘要中,结果表明这种方法在可扩展性方面表现优于以前的模型。
- 辅助跨度提取:辅助跨度提取任务在验证事实一致性过程中提供了有用的帮助。
3. 项目最近更新的功能
- 数据文件更新:手动注释的数据文件已更新,修复了文件路径错位示例。
- 模型检查点文件更新:重新计算了修正示例的评价指标。
- 代码优化:项目代码持续优化,提高了稳定性和性能。
(文章完)
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考