RWKV-5/6 论文被 COLM 2024 收录

由 Bo PENG 和 RWKV 开源社区共同完成的 RWKV-5/6架构论文《Eagle and Finch: RWKV with Matrix-Valued States and Dynamic Recurrence》被顶级会议 COLM 2024 收录

这是继 RWKV-4 架构论文《RWKV: Reinventing RNNs for the Transformer Era》被 EMNLP 2023 收录之后,RWKV 又一篇被国际顶会认可的论文。

COLM 接收 RWKV 5/6 论文

作为 RWKV 社区代表,Stella Biderman 出席本次 COLM 2024 演讲:

在这里插入图片描述

在这里插入图片描述

关于 COLM 会议

Conference On Language Modeling(COLM)会议是一个大语言模型领域的新会议,由 Sasha Rush、Denny Zhou、Yejin Choi 等 NLP 头部科学家联合创立。

COLM 会议的主题包含语言模型的对齐、学习算法、推理算法、多模态等 17 个方面的研究,通过创建一个专注于语言建模研究的学术平台,理解、改进和批评 LM(语言模型)技术的发展。

COLM 2024 于 2024 年 10 月 7~9 日在美国费城宾夕法尼亚大学召开。

RWKV-5/6 论文简介

RWKV-5/6 论文提出了两种新的 RWKV 架构:Eagle (RWKV-5) 和 Finch (RWKV-6),这两个新的论文架构在 RWKV-4 架构的基础上进行了改进。

相对 RWKV-4 版本架构, RWKV-5-Eagle 的重点改进在于引入了多头的、基于矩阵值的状态(multi-headed matrix-valued states)。RWKV-6-Finch 架构则借鉴了 LoRA 技术,进一步改进了 RWKV 架构中的 token shift 和 time-mixing 模块。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值