自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

weixin_57523712的博客

原创 2023.4.2 第二十次周报

大量文献表明，基于提示的学习是一种利用预先训练好的大型语言模型的有效方法。最近的研究也展示了通过插入适当的提示来控制聊天机器人输出的可能性。基于梯度的方法通常用于干扰提示。然而，有些语言模型甚至还没有向公众开放。在这项工作中，我们首先探索了提示（prompt）和强化学习(RL)的结合，在不访问任何模型参数的情况下引导模型的生成。其次，为了减少训练工作量，增强对未见任务的泛化能力，采用多任务学习，使模型更好地学习泛化新任务。

2023-04-02 14:12:40 555

原创 2023.3.26 第十九次周报

在过去的几年里，我们已经看到了几十个Transformer family的模型的迅速出现，所有这些都有有趣的，但不是不言自明的名字。本文的目标是为最流行的Transformer模型提供一个比较全面但简单的目录和分类。本文还介绍了Transformer模型中最重要的方面和创新。

2023-03-26 19:06:37 715

原创 2023.3.19 第十八次周报

EMLo模型

2023-03-19 21:09:35 338

原创 2023.3.12 第十七次周报

BERT

2023-03-12 21:57:24 292

原创 2023.3.5 第十六次周报

机器学习

2023-03-05 22:34:51 250

原创 2022.2.26 第十五次周报

机器学习

2023-02-26 13:56:04 727

原创 2023.2.19 第十四次周报

深度学习1

2023-02-19 15:18:01 746

原创 2022.2.5 第十三次周报

膨胀卷积

2023-01-08 22:00:20 801 1

原创 2022.1.1 第十二次周报

gru

2023-01-01 21:34:53 681

原创 2022.12.11 第十一次周报

lstm

2022-12-11 21:57:57 706

原创 2022.12.04 第十次周报

attention

2022-12-04 22:51:55 197

原创 2022.11.27 第九次周报

RNN数学公式

2022-11-27 20:27:09 383

原创 2022.11.20 第八次周报

Rnn的学习

2022-11-20 21:30:40 939 1

原创 2022.11.13 第七次周报

卷积神经网络

2022-11-13 22:35:27 983

原创 2022.11.05 第六次周报

卷积神经网络两个基础模型

2022-11-06 22:57:29 1054

原创 2022.10.23 第五次周报

cnn

2022-10-23 19:22:08 1138

原创 2022.10.16 第四次周报

cnn卷积神经网络

2022-10-16 23:24:02 539

原创 2022.10.10 第三次周报

基础神经网络和线性回归方程

2022-10-02 20:53:47 664

原创 2022.9.25 第二次周报

第二周学习计划，有点乱。

2022-09-25 19:43:55 882

原创 2022.9.16 第一次周报

学习笔记

2022-09-16 21:37:02 649

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

杨幂臭脚丫子

博客等级

码龄5年

20
原创

1
点赞

12
收藏

12
粉丝

关注

私信

热门文章

最新评论

2022.2.5 第十三次周报
每天睡个好觉就行: 你好，我也看到了这篇文章，方向是时间序列的分类，可以一起交流一下吗？qq:1967847446
2022.11.20 第八次周报
java李杨勇: 好文章写的确实不错，支持，欢迎大佬也来点评我的置顶文章！

提示

确定要删除当前文章？

取消删除