RAG挑战来袭:长上下文的LLMs会取代RAG系统吗?

2023年,上下文LLMs窗口一般在4K-8K左右。但是,截至 2024 年 7 月,LLMs上下文窗口超过 128K 的情况很常见。
在这里插入图片描述

例如,Claude 2 有一个 100K 的上下文窗口。Gemini 1.5 声称有 2M 的上下文,后来的 LongRoPE 声称将LLM上下文窗口扩展到 200 万个令牌之外。此外,Llama-3–8B-Instruct-Gradient-4194k 的上下文长度为 4194K。使用LLMs时,上下文窗口的大小似乎不再是一个问题。
在这里插入图片描述

在Llama-3.1模型发布之前,开源模型与闭源模型之间的性能差距一直较为显著,尤其体现在对长上下文的理解能力上。开源模型在处理长文本时通常面临更大的挑战,其上下文理解和信息整合能力往往不及闭源模型。随着Llama-3.1的推出,这一差距有所缩小,开源模型在长上下文处理上的表现得到了显著提升。

最近,NVIDIA 研究团队在开源模型 Llama-3 的基础上,通过一系列创新技术显著提升了其上下文处理能力。他们将 Llama-3 的上下文长度从原有的 8K 扩展到了 128K,实现了上下文长度的 16 倍增长。经过这种扩展,Llama3-ChatQA-2-70B 模型在长上下文理解能力上已经超越了 GPT-4,展示了更强的性能和更深的理解能力。

<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Soyoger

听说打赏的都进了福布斯排行榜。

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值