Google开源了LaserTagger,一种可加速文本生成的AI模型

Google的LaserTagger是一个开源文本编辑模型,专注于预测一系列编辑操作来改善文本生成,解决了传统序列到序列模型的训练数据需求大和执行速度慢的问题。与逐字生成相比,LaserTagger更高效且不易出错,适用于语法错误纠正、句子合并等任务。在多项文本生成任务中,LaserTagger表现优秀,速度比序列到序列模型快100倍,适合大规模应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

序列到序列AI模型由Google于2014年推出,旨在将固定长度的输入(通常是文本)与固定长度输出映射,其中输入和输出的长度可能会有所不同。它们被用于文本生成任务,包括摘要,语法错误纠正和语句合并,并且最近的体系结构突破使它们相比以前能够发挥出更大的作用。

 

但是该模型本身并不完善,因为它们(1)需要大量的训练数据才能达到可接受的性能水平,(2)而且通常需要逐字生成输出(这会使它们固有地变慢)。这就是Google研究人员开发LaserTagger的原因,LaserTagger是一种开放源代码的文本编辑模型,该模型可以预测将源文本转换为目标文本的一系列编辑操作。研究人员宣称LaserTagger以一种不易出错的方式处理文本生成,并且更易于训练和执行。

github地址:https://github.com/google-research/lasertagger论文地址:https://arxiv.org/pdf/1909.01187.pdf

LaserTagger的发布紧随Google在自然语言处理和理解领域做出的杰出贡献。上周,这家科技巨头推出了Meena聊天机器人模型。

 

Meena是一个具有26亿个参数的端到端训练的神经网络对话模型。根据Google的说法,Meena经过30天的训练,使用了2,048张量处理单元(Google专用的AI专用芯片),数据集为400亿个单词(不是随机的)。Google挖掘了公共领域的社交媒体,以进行“多回合对话”,其中“回合”指的是对话中的一对短语。

然而即使Google开源了Meen

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值