文章主要内容
- 研究背景:文本简化研究多集中于词汇和句子层面,文档级简化受关注少。大语言模型(LLMs)在文档总结任务表现好,但在文档简化任务中存在不足,常将其视为总结任务,无法满足简化要求。
- 相关工作:回顾文档级文本简化、基于LLMs的文本简化以及分层文本生成的研究现状,指出当前方法的问题与局限。
- 方法
- SumDS方法:先为源文档生成摘要,再依据摘要指导各段落进行简化操作。
- ProgDS方法:将文档简化任务分解为语篇级、主题级和词汇级简化三个层次,按层次逐步简化,且在文档内部对主题级和词汇级简化进行多次迭代。同时介绍了上下文学习在两种方法中的应用。
- 实验:以Newsela-auto和Wiki-auto数据集为基础,选择多种评估指标,对比SumDS、ProgDS与多个基线模型。结果表明,SumDS和ProgDS在多数指标上优于传统模型和直接使用C