LongCodeZip: Compress Long Context for Code Language Models

在这里插入图片描述

一、论文主要内容总结

1. 研究背景与问题

随着代码大语言模型(Code LLMs)在软件开发中广泛应用(如代码补全、总结、问答),长上下文处理需求日益迫切。但现有方案存在三大瓶颈:

  • 效率与成本问题:Transformer注意力机制的二次复杂度导致长输入处理延迟高,API调用成本随token数量剧增;
  • 相关性识别困难:模型难以在海量代码中定位关键信息;
  • 上下文窗口限制:即使支持128k token的模型,处理大型代码库或长对话时仍会因截断导致输出质量下降。

同时,现有上下文压缩方法存在缺陷:通用文本压缩(如LLMLingua)忽略代码结构与依赖;检索增强生成(RAG)依赖表面语义相似性,易遗漏隐式依赖;传统代码压缩(如DietCode)仅支持函数级修剪,无法应对长上下文场景。

2. 核心方案:LongCodeZip框架

LongCodeZip是专为代码LLMs设计的无训练、模型无关、即插即用的长上下文压缩框架,采用“粗粒度+细粒度”两阶段压缩策略,在减少token消耗的同时保留代码语义:

<
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值