- 博客(20)
- 收藏
- 关注
原创 2023.4.2 第二十次周报
大量文献表明,基于提示的学习是一种利用预先训练好的大型语言模型的有效方法。最近的研究也展示了通过插入适当的提示来控制聊天机器人输出的可能性。基于梯度的方法通常用于干扰提示。然而,有些语言模型甚至还没有向公众开放。在这项工作中,我们首先探索了提示(prompt)和强化学习(RL)的结合,在不访问任何模型参数的情况下引导模型的生成。其次,为了减少训练工作量,增强对未见任务的泛化能力,采用多任务学习,使模型更好地学习泛化新任务。
2023-04-02 14:12:40
555
原创 2023.3.26 第十九次周报
在过去的几年里,我们已经看到了几十个Transformer family的模型的迅速出现,所有这些都有有趣的,但不是不言自明的名字。本文的目标是为最流行的Transformer模型提供一个比较全面但简单的目录和分类。本文还介绍了Transformer模型中最重要的方面和创新。
2023-03-26 19:06:37
715
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
1