Scaling Up Summarization: Leveraging Large Language Models for Long Text Extractive Summarization

本文是LLM系列文章,针对《Scaling Up Summarization: Leveraging Large Language Models for Long Text Extractive Summarization》的翻译。

扩大摘要:利用大型语言模型进行长文本提取摘要

摘要

在数字文本以前所未有的速度激增的时代,高效的摘要工具变得不可或缺。虽然大型语言模型 (LLM) 已成功应用于各种 NLP 任务,但它们在提取文本摘要中的作用仍未得到充分探索。本文介绍了 EYEGLAXS(用于提取摘要的简单而高效的大型语言模型),这是一个利用 LLM(特别是 LLAMA27B 和 ChatGLM2-6B)对长文本文档进行提取摘要的框架。 EYEGLAXS 不采用经常出现事实不准确和幻觉等问题的抽象方法,而是专注于提取摘要,以确保事实和语法的完整性。 EYEGLAXS 利用 Flash Attention 和参数高效微调 (PEFT) 等最先进的技术,解决了通常与LLM相关的计算和资源挑战。该系统在 PubMed 和 ArXiv 等知名数据集上设定了新的性能基准。此外,我们通过额外的分析扩展了我们的研究,探索LLM处理不同序列长度的适应性及其在较小数据集上训练的效率。这些贡献不仅在该领域树立了新标准,而且为提取文本摘要的未来研究开辟了有希望的途径。

1 引言

2 文献综述

3 方法

4 实验

5 结果与分析

6 结论

本文介绍了 EYEGLAXS,这是一种利用大型语言模型 (LLM) 进行长文本提取摘要的新颖系统。我们的工作挑战了对仅编码器模型的传统依赖,展示了LLM在管理不同序列长度方面的适应性,并为 PubMed 和 arXiv 数据

### Olive:硬件友好型异常值-受害者配对量化加速大型语言模型 研究指出,在处理大规模变换器模型时,异常值对于计算性能有着显著影响,而受害者的贡献相对较小[^1]。基于这一观察,提出了Olive——一种专门针对硬件优化设计的异常值-受害者配对量化方法。 #### 设计理念 Olive的核心设计理念在于通过对齐异常值感知量化来提升计算效率。具体来说,该方案旨在识别并优先处理那些具有较大数值范围的数据点(即异常值),同时适当忽略或简化其他数据点(即受害者)。这种方法不仅能够有效减少不必要的计算开销,还能保持较高的精度水平。 #### 技术实现 为了达到上述目标,Olive引入了一种新颖的编码策略: - **异常值检测**:利用统计学原理自动筛选出潜在的异常值。 - **自适应量化参数调整**:根据不同层的特点动态设置最佳量化位宽。 - **高效映射算法**:确保经过量化的权重能够在实际部署环境中快速加载和执行。 ```python def olive_quantize(weights, outlier_threshold=3.0): """ 应用Olive量化技术于给定权重组 参数: weights (numpy.ndarray): 待量化的浮点数数组 outlier_threshold (float): 判定异常值的标准差倍数 返回: quantized_weights (numpy.ndarray): 已经被量化的整数形式表示的新数组 """ mean = np.mean(weights) std_dev = np.std(weights) outliers = abs((weights - mean)) > outlier_threshold * std_dev non_outliers = ~outliers # 对非异常值应用较低分辨率量化 low_res_scale_factor = calculate_low_resolution_scaling(non_outliers) quantized_non_outliers = apply_quantization(low_res_scale_factor, non_outliers) # 对异常值单独进行高分辨率量化 high_res_scale_factor = calculate_high_resolution_scaling(outliers) quantized_outliers = apply_quantization(high_res_scale_factor, outliers) combined_result = merge_results(quantized_non_outliers, quantized_outliers) return combined_result ``` 此函数展示了如何区分正常值与异常值,并分别为其分配不同的量化尺度因子,从而实现了更精细且高效的量化过程。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值